南京市建邺区政府积极探索公共机构餐饮服务改革,智慧食堂应运而生。该系统集成了现代信息技术,通过预约制度,运用人脸识别等技术,为机关食堂的运营管理提供了新的思路和方法,显著降低了食品浪费。智慧食堂的运行不仅体现了技术创新,更彰显了管理创新和理念更新。它通过精确控制食品的准备量,最大限度地减少了因过量备餐而造成的浪费。同时,引导用餐者养成良好的预定习惯,提高用餐计划性,从而进一步降低无谓的食品废弃。此外,智慧食堂针对未预订等紧急情况提供现场窗口,确保了服务的人性化和灵活性,体现了公共餐饮服务的温度。然而,智慧食堂作为一个新兴事物,其运营模式和管理体系仍有待进一步完善。特别是在数据驱动决策方面,如何利用好大数据、人工智能等现代技术手段,对用餐行为进行深入分析和预测,从而实现食品准备量的动态优化,是未来智慧食堂发展的关键。
一、数据收集与预处理
(一)数据收集与数据库构建
本研究的数据来源为南京市建邺区机关食堂,该食堂采用了先进的智能餐饮管理系统,实现了菜品的精细化管理、库存的实时监控以及消费数据的自动采集,能够为本研究提供大量详实的数据支持,其数据的真实性和准确性得到了较好保障。
本次研究的数据集共计1186个样本,10个特征。数值型特征10个,包括“每天用餐人数”、“预订订餐人数”、“每天未核销订单人数”、“每天刷卡扫码人脸支付人数”、“订单匹配率”等特征。时间跨度为1186天,从2021年1月1日到2024年3月31日。样本数量为每天的数据,共计1186个。
各个变量的含义如下:
1.每天用餐人数,表示每天在机关智慧食堂就餐的人数。
2.预订订餐人数,表示每天通过预订方式订餐的人数。
3.每天未核销订单人数,表示每天在机关智慧食堂产生的未核销订单的人数。
4.每天刷卡扫码人脸支付人数,表示每天通过刷卡、扫码和人脸支付方式进行支付的人数。
(二)数据清洗与预处理
在收集的数据中,每日的数据基本无错误数据,数据质量较高,因此暂时不需要对数据进行清洗。但在建模阶段,由于每年节假日不一致且有调休现象,导致很多天数用餐人数很少甚至几乎为零。这些异常且不可控的数据点可能会对模型产生负面影响。为了解决这个问题,在建模阶段决定去掉这部分异常且不可控的数据点。在对预定用餐占比进行建模前,在时间序列上可以看到一些很明显的跳点,这些异常点会影响模型的预测效果,因此利用箱线图法去除异常点,使时间序列变得更加平稳。
(三)关键性能指标定义与计算方法
订单匹配率,指在统计时间内,机关智慧食堂成功匹配用户订餐需求与实际提供餐品的比率。这个指标可以反映食堂在满足用户需求方面的能力,以及菜品供应和调整的效果。
用餐率,指在统计时间内,机关智慧食堂实际用餐人数占总客流量的比例。这个指标可以帮助了解食堂的就餐环境和服务质量,以及用户对食堂的整体满意度。
预定用餐占比,指在统计时间内,机关智慧食堂预定用餐人数占总用餐人数的比例。这个指标可以反映食堂预订服务的普及程度,以及用户对预订餐品的依赖程度。
违约率,指在统计时间内,机关智慧食堂取消预订或未按时用餐的用户占总预订订餐人数的比例。这个指标可以帮助了解用户对食堂预订服务的信任度,以及食堂在应对突发情况和维护用户权益方面的表现。
线上支付率,指在统计时间内,机关智慧食堂使用线上支付方式完成用餐的人数占总用餐人数的比例。这个指标可以反映用户对线上支付方式的需求和接受程度,以及食堂在支付安全和便捷性方面的技术水平。
未预定用餐人数,指在统计时间内,机关智慧食堂没有进行预订就直接用餐的人数。这个指标可以帮助了解用户的用餐习惯和就餐需求,以便食堂针对性地进行优化和改进。
(四)预测模型的选择与构建
ARIMA模型,全称自回归整合移动平均模型,是一种广泛应用于时间序列预测的统计模型。本次模型构建策略是选取2023年3月1日之前的数据为训练集,之后的数据为测试集。
二、数据分析与结果
(一)描述性统计分析
提供的原始数据和衍生指标描绘了一个用餐及支付行为的全景图,其中用餐人数和预订订餐人数显示出较大的波动性,而像违约率这样的指标则总体较低但有特殊情况下的剧增。订单匹配率和预定用餐占比通常较高,表明效率和计划性在用餐管理中起着重要作用。
每天用餐人数:平均每天约728人用餐,人数从最少的1人到最多的1464人不等。方差为342.60,表明用餐人数的波动性较大。中位数为780,意味着一半的时间,用餐人数超过780人。
预订订餐人数:平均每天约有451人预订订餐,人数范围从1人到1131人。方差为215.63,说明预订人数有一定的波动。中位数为517,表示大多数时间预订人数在517左右。
每天未核销订单人数:平均每天未核销的订单人数为1.83人,几乎所有的未核销订单人数集中在0人,最高达到147人。这表明大多数情况下未核销订单人数很少。
每天刷卡扫码人脸支付人数:平均每天有约352人通过刷卡、扫码或人脸支付。支付人数的范围从0人到1435人,方差为366.49,显示较高的波动性。中位数为325人,反映了一般情况下的支付人数。
订单匹配率:订单匹配率的平均值为72%,范围从0%到100%。方差为0.26,表明订单匹配率的变化相对较小。中位数也为72%,说明大多数情况下订单匹配率是比较高的。
预定用餐占比:平均预定用餐占比为71.94%,最低为0.07%,最高达100%。方差为25.70%,显示预定用餐占比在不同天之间有一定差异。中位数为71.52%,表明预定用餐在大多数时间内占比较高。
违约率:平均违约率为0.39%,最高达到28.18%。方差为1.86%,表明违约率整体较低但在某些情况下会有较大的波动。大多数时间的违约率为0%。
线上支付率:平均线上支付率为36.44%,从0%到100%不等。方差为28.70%,反映出线上支付率的变化较大。中位数为40.80%,表示在一半以上的时间里线上支付率高于这一比率。
(二)预测模型结果与准确性分析
1.差分分析
在进行ARIMA模型建立前,需先通过差分分析消除时间序列数据的非平稳性。非平稳性指数据均值、方差或自相关系数随时间变化,影响模型对趋势和季节性的捕捉。差分操作使数据达到平稳状态,此时均值、方差和自相关系数恒定,有助于ARIMA模型拟合和预测。例如,机关智慧食堂反食品浪费研究中,通过一阶和二阶差分处理原始数据,可去除随机波动,提取主要趋势,满足平稳性要求,为决策提供支持。
2.自相关和偏相关分析
在建立ARIMA模型前,需进行自相关和偏相关分析以了解时间序列的特性。对于减少机关智慧食堂食品浪费的大数据分析,ACF图和PACF图为关键工具。综合观察这两种图形,可以判断数据是否适合使用ARIMA模型。如果ACF和PACF图都显示这种衰减模式,则数据适合ARIMA模型建模。
3.回归系数估计
根据提供的ARIMA模型的显著水平参数表,以下是对模型进行分析的结果:
模型使用的是ARIMA(2, 0, 2)模型。ARIMA是一种常用的时间序列预测模型,其中2表示自回归项和移动平均项的阶数,0表示差分次数。
对数似然值(Log Likelihood),在所有可能的模型中,该模型的对数似然值为671.406,它衡量了模型拟合数据的好坏程度。较高的对数似然值表示模型能够更好地解释数据中的模式。
AIC是一个综合指标,用于在模型选择过程中权衡模型的拟合优度和复杂度。在该模型中,AIC值为-1330.812,它考虑了模型的拟合优度和复杂度,并通过比较不同模型的AIC值来选择最佳模型。BIC与AIC类似,也是一种用于选择最佳模型的指标。在该模型中,BIC值为-1301.371。
根据提供的参数表分析结果显示,ARIMA(2, 0, 2)模型具有较高的对数似然值和较低的AIC/BIC/HQIC值,因此可以认为该模型是拟合数据效果较好的一种选择。
4.模型残差分析
残差分布平稳表明模型准确描述数据动态变化,无趋势和季节性,预测准确性高。平稳残差说明模型稳定,不受时间影响。残差直方图接近正态分布表示模型拟合好,误差项无系统性偏差。残差正态QQ图检验模型拟合效果,图中点沿直线排列则残差分布与正态一致,偏离可能指示模型问题。
5.模型准确性分析
根据预测的时间序列与实际时间序列曲线基本重合,可以得出以下结论:
(1)模型拟合度高:预测曲线与实际曲线非常接近,说明模型能很好地拟合实际数据,捕捉到时间序列的动态变化和趋势,准确预测未来值。
(2)预测准确度高:预测曲线与实际曲线基本一致,表明模型的预测结果可靠,对决策者具有很大参考价值。
(3)模型稳定性强:预测曲线与实际曲线的重合说明模型在不同时间段内表现稳定,不受时间变化或其他因素影响。
(4)可解释性强:预测曲线与实际曲线的重合也表明模型能够合理解释时间序列中变量之间的关系,有助于理解预测结果。
(三)数据挖掘分析结果
1.趋势分析结果
根据提供的数据,可以对年度日平均用餐人数进行趋势分析。从2021年到2024年,年度日平均用餐人数呈现出波动的趋势。2021年的年度日平均用餐人数为764.45人,2022年下降至616.37人,2023年回升至688.92人,2024年再次下降至667.70人。这种变化可能受季节性因素、人员变动、食堂服务质量、菜品种类和价格等多种因素影响。
对季度日平均用餐人数进行趋势分析。在2021年3月31日至2024年3月31日期间,季度日平均用餐人数呈现出一定的波动性,如图1所示。
图1 季度日平均用餐人数历史趋势图
在2021年第一季度,日平均用餐人数为885.08人。到2021年第三季度,该指标下降至647.95人。在2021年第四季度,季度日平均用餐人数进一步下降至622.23人。
进入2022年,季度日平均用餐人数开始回升。在第一季度,该指标上升至591.29人,第二季季度下降至624.11人,第三季度上升至685.90人,第四季度下降至563.72人。
进入2023年,季度日平均用餐人数继续波动。在第一季度,该指标上升至652.24人,第二季度下降至682.60人,第三季度上升至704.29人,第四季度再次上升至715.65人。
根据以上数据,可以得出以下结论,季度日平均用餐人数呈现出一定的波动性,但整体趋势是上升的。这种变化可能受到多种因素的影响。例如,季节变化、节假日安排、机关内部人员变动。还可能存在其他未被提及的因素,如政策调整、经济发展等,这些因素也可能对用餐人数产生重要影响。
从图2中可以看到,每月的用餐人数在2021年至2024年期间有明显的波动。用餐人数在2021年初达到最高点,然后逐渐下降,直到2023年底开始逐渐上升,然后在2024年初再次达到一个高峰。
图2 月度日平均用餐人数历史趋势图
这种趋势可能与多种因素有关,包括季节性变化、工作日和非工作日的差异、特殊事件或活动的影响等。例如,如果数据中的用餐人数是指机关工作人员的用餐人数,那么在学年开始和结束、假期前后,以及一些特殊日期(如国庆、春节等),用餐人数可能会有显著的变化。如果机关食堂的菜品种类、质量和服务水平等因素发生变化,也可能影响到用餐人数。
2.周期性分析结果
从数据分析结果来看,并没有发现明显的周期性规律。也就是说,用餐人数在不同季度之间并没有呈现出明显的增长或减少的趋势。
机关智慧食堂的用餐人数可能受到季节性因素的影响。例如,在某些季节,人们可能会选择外出就餐或进行其他活动,从而导致用餐人数的下降。一些特殊事件或假期也可能对用餐人数产生影响,例如春节、国庆节等。
用餐人数的变化还可能与机关内部的人员变动有关。例如,新员工的入职或离职、出差等情况都可能对用餐人数产生一定的影响。机关内部的工作时间安排、工作强度等因素也可能对用餐人数产生影响。
用餐人数的变化还可能与外部因素有关,例如天气状况、交通情况等。恶劣的天气条件可能会导致人们减少外出就餐的次数,从而影响到用餐人数。
尽管每天用餐人数在不同年份和季度之间存在一定的波动,但并没有明显的周期性规律。这可能是由于多种因素的综合影响所导致的,包括季节性因素、机关内部人员变动以及外部因素等。为了进一步深入研究反食品浪费问题,需要综合考虑这些因素,并结合更多的数据进行分析和建模。
图3 季度日平均用餐人数周期分析图
通过对数据的分析,可以得出以下结论,用餐人数的波动情况并不存在明显的周期性。尽管每年的用餐人数都有一定的波动,但这些波动并没有呈现出明显的规律性,如图4所示。用餐人数的变化可能是由于多种因素的综合影响所导致的。
图4 月度日平均用餐人数周期分析图
为了进一步解释这些现象,可以进行更深入地研究。例如,可以收集更多的数据,包括不同时间段的用餐人数、天气情况、节假日等信息,以更全面地了解用餐人数波动的原因。还可以进行问卷调查或访谈,了解员工对用餐人数波动的看法和感受。通过这些研究方法,可以更好地理解用餐人数波动的原因,并提出相应的解决方案来减少食品浪费。
根据提供的数据,可以观察到一种周期性的模式,其中用餐人数在工作日普遍较高,而在周末则显著下降,如图5所示。这种模式在连续几年的数据中都有所体现,表明这不是一个偶然现象,而是反映了一定的规律性行为。
图5 周度日平均用餐人数周期分析图
具体来看,2021年的工作日用餐人数平均在962.82到1028.94之间,而周末的人数则下降到136.48到243.73。2022年至2024年的数据也显示出类似的趋势,尽管整体用餐人数有所下降,但工作日与周末的用餐人数差异依然明显。
这种现象的原因可能与机关单位的工作时间安排有关。在工作日员工需要到食堂就餐以方便工作,因此用餐人数较多。而在周末员工不需要上班,可能会选择外出就餐或在家中用餐,导致食堂用餐人数减少。
还可以从数据中观察到一些细微的变化。例如,2022年与2021年相比,整体用餐人数有所下降,这可能与当时的社会环境、政策变化或其他因素有关。而到了2023年和2024年,虽然整体用餐人数有所回升,但周末的用餐人数仍然较低,这可能说明员工的生活习惯或外部餐饮服务的选择发生了变化。
(四)减量优化策略的模拟结果
由于当前的ARIMA模型在预测方面的表现并不尽如人意,其准确性有待提高。同时,通过对数据的深入挖掘和分析,我们注意到一个显著的现象:在周末以及节假日期间,用餐人数的波动幅度相当大。这种大幅度的波动给餐饮管理和资源分配带来了不小的挑战。
鉴于上述情况,建议采取更为谨慎和精确的策略来应对这一挑战。建议重点关注并核实订餐人数,确保我们能够准确掌握顾客的实际需求。这样做的好处是多方面的。
准确核实订餐人数可以避免因预测不准确而导致的资源浪费。无论是食材采购、人员安排还是场地布置,都需要根据实际的用餐人数来进行合理的规划和调整。如果预测人数与实际人数相差较大,可能会导致食材过剩或不足、人员过多或过少、场地布置不合理等问题,从而造成不必要的浪费和运营成本的增加。
准确核实订餐人数可以提高顾客满意度。通过及时了解顾客的订餐需求,可以更好地满足他们的口味偏好和用餐体验。这不仅能够提升顾客的满意度,还有助于建立良好的口碑。
准确核实订餐人数还可以帮助我们优化运营管理。通过对订餐数据的分析和挖掘,我们可以发现一些潜在的规律和趋势,从而为未来的决策提供有力的数据支持。例如,可以分析不同时间段的订餐高峰期,以便合理安排人力资源;还可以分析顾客的口味偏好和消费习惯,以便推出更受欢迎的菜品和服务。
为了提高预测的准确性、避免资源浪费、提升顾客满意度以及优化运营管理,建议采用要求重点核实订餐人数的策略。通过这一措施的实施,以更好地应对周末和节假日用餐人数的波动带来的挑战,实现餐饮业务的稳健发展。
三、菜品数据挖掘分析
(一)热门菜品分析
通过大数据分析,发现食堂西红柿炒蛋的提供次数远高于其他菜品,可能是因为它是一道非常经典且普遍受欢迎的家常菜,适合不同口味的人群。此外,它的制作简单,成本较低,因此可能会更频繁地出现在食堂的菜单上。
其他菜品的提供次数相对均衡,但肉汁萝卜和鱼香肉丝的提供次数相对较高,这可能是因为这两道菜的味道更加丰富可口。而糖醋青椒、家常豆腐和蒜泥生菜等菜品的提供次数稍低,可能是因为它们的口味相对单一或者较为常见,不足以吸引大量食客。
菜品的提供次数可能受到多种因素的影响,包括菜品的味道、价格、营养价值、制作难度和食客的个人喜好等。食堂可能会根据这些数据来调整菜单,以满足食客的需求和偏好。
(二)菜品对用餐人数影响分析
本次研究将根据不同菜品分成有菜品组和无菜品组,采用Mann-Whitney U检验来研究菜品对用餐人数是否有显著影响,例如,研究“三鲜煮干丝”对用餐人数影响时,将食堂提供“三鲜煮干丝”菜品时的用餐人数划分为“有菜品组”,将不提供该菜品时划分为“无菜品组”。当Mann-Whitney U检验的p-value<0.01时,说明两组用餐人数有显著差异,即说明该菜品对用餐人数多少有显著影响。如果有菜品组用餐人数的均值大于无菜品组时,说明该菜品可以提升用餐人数,反之,则会降低用餐人数。
通过对食堂2822个菜品的逐一进行Mann-Whitney U检验,发现其中41个菜品可以提升用餐人数,88个菜品会降低用餐人数,其余菜品影响用餐人数不显著。
四、政策建议与结论
通过大数据分析,发现机关智慧食堂的用餐人数在不同时间段存在显著波动。基于这一发现,建议动态调整食品采购策略,利用历史数据和预测模型结果来精准控制每日采购量,避免食品过剩或不足。同时,优化预订订餐流程,鼓励员工提前预订餐食,减少未核销订单,提升订单匹配率和实际用餐率。针对节假日等特殊时期,制定专项管理策略,提前预判用餐需求,避免资源浪费。此外,建立有效的员工反馈机制,及时了解员工需求和建议,持续改进食堂运营。
展望未来,可以引入更先进的智能预测模型,如深度学习模型,以提高用餐人数预测的准确性和稳定性。这将为食堂的精细化管理和放量优化提供更加科学的依据。同时,强化数据驱动决策,建立全面的决策支持系统,涵盖食材采购、菜品供应、人员安排等各个环节,实现食堂运营的全面优化。还应积极推动技术创新与应用,引入物联网、人工智能等先进技术,提升食堂的运营效率和管理水平。通过实施精准营销与服务,满足员工的个性化需求,提升食堂的用餐满意度。
作者:何勇、王子欢、冷祥宇、陈晓峰、李洁、王中华
作者单位:东南大学机关事务研究中心、南京市建邺区区级机关事务管理服务中心、南京市机关事务管理局
本文获2024年研究成果鉴定一等奖