加强光宽QoE质差用户闭环管控,提升用户质差修复量效
孙 丽
(山西电信分公司,山西 太原 030006)
近年来,光宽用户的互联网使用行为更加趋向于视频类、游戏类等高带宽低时延的应用,用户对光宽业务的服务质量敏感度大大提高[1]。而光宽用户业务感知评价涉及应用、平台、网络等多个环节,业务质量劣化的修复与根因分析工作面临着故障定位难度大、修复量效无法评估的问题,急需打造对用户感知劣化的闭环管控手段,形成有效的系统性解决方案。
目前已建成光宽端到端的业务监测系统可实现地市级的光宽QoE指标评价,对单个质差用户无法实现自动闭环管控。光宽QoE质差用户闭环管控解决方案旨在实现海量用户网关探针数据的高效分析、问题的精准定位、修复量效后评估与根因分析。解决思路如下。
(1)通过系统间接口自动获取用户探针数据。
(2)通过添加QoE质差用户标签并与网络类、服务类标签关联,自动触发预检预修工单。
(3)通过QoE质差标签与超长在线网关的标签关联,触发网关批量重启工单,清除质差标签。
(4)通过定制自动化报表,完成质差用户修复量效的后评估工作。
(5)通过统计频繁质差的网站信息,结合省内平台,精准定位网站质差根因。
以提升光宽业务感知与网络质量为目标,以光宽QoE指标为抓手,以提高QoE质差用户的修复量效为手段,提出自动化的解决方案;
将集团光宽端到端的业务监测系统采集的山西全省的光宽探针测试数据引入大数据湖,利用大数据分析手段,实现对单个用户感知的监测、分析、修复、效果后评估等闭环管控;
定位频繁质差SP网站的根因。光宽QoE质差用户闭环管控逻辑示意图如图1所示。
3.1 光宽QOE质差用户数据入湖
打通光宽端到端的业务监测系统与大数据平台接口,通过sftp方式从QoE网站上定时抓取用户http记录,根据质差记录分析标准,过滤并标记QoE质差用户清单[2]。实现全省QoE质差用户数据自动入湖,数据采集分析周期由每周人工调取缩短为每日自动获取。统计标准如下。
(1)单条http测试数据质差判定条件:只要满足以下一个条件即记为质差。一是首页响应时延大于当前数据中SP站点的上周首页响应时延均值的1.5倍(如果上周的SP站点里没有当前数据的SP站点,那就取int类型的最大值的1.5倍)。二是访问不成功。
(2)用户质差记录判定条件:一天内单用户质差次数的占比超过阈值(集团标准为45%,省内标准为30%)即判断为质差。反之则为优良用户。
3.2 光宽QoE质差用户多标签关联
通过健康档案系统为QoE质差用户生成质差标签并与用户多标签关联,同时为质差用户标签赋予高权重,优先派发工单池中携带用户质差标签的预检预修工单,并根据工单中标签分类,为一线提供明确的检修指令,做到“全流程闭环管控,多环节优化管理”。多标签分类与统计规则如图2所示。
图2 多标签分类与统计规则
3.3 光宽QoE质差用户超长在线网关自动重启任务的定制
定制QoE质差用户超长网关自动重启任务,经健康档案系统派发到ITMS系统,为避免工单排队轮空,制定优先触发QoE质差,超长在线网关重启机制,在实现超长在线用户质差标签自动修复的同时,减少向地市派发的工单数量,降低一线装维的工作量。统计标准如下。
(1)统计需求:实现宽带QoE质差用户执行自动重启的修复成功率关联查询。
(2)统计口径:通过接入适配方式向健康档案提供网关在线超过9天的账号明细。
(3)统计公式:QoE质差超长在线用户修复成功率=(QoE与网关超长在线双标签用户数-后评估阶段相应双标签未清除的用户数)/QoE与网关超长在线双标签用户数
2022年9月,QoE质差超长在线用户重启工单85单,自动修复成功率为35.29%,鉴于省内探针部署量仅为57万,随着省内探针覆盖面的增加,预计每年QoE质差自动修复的工单数量为3 000单。QoE质差超长在线用户修复效果如图3所示。
图3 QOE质差超长在线用户修复效果
3.4 光宽QoE质差用户修复量效后评估
实现按照省、地市、用户等多维度的修复量效后评估,精准定位单个用户的标签修复类型、修复数量,判定修复后用户质差标签携带情况,跟踪评估QoE预检预修工单的回单修复率和成功率。统计标准如下。
(1)统计需求:可以实现宽带QoE质差标签的修复量效的多维度关联查询。
(2)统计口径:回单成功的QoE质差工单数。
(3)统计公式:QoE质差用户修复成功率=(QoE质差工单回单成功的工单数-后评估阶段打标QoE标签的工单数)/回单成功的工单数
2022年6月至9月,光宽QoE质差用户的预检预修工单共计派发3 422单,成功回单3 219单,回单成功率为94.07%。处于评估周期内的工单数量为2 839单,后评估阶段标签清除工单数为1 848单,总体修复成功率为65.09%。
3.5 http频繁质差网站统计
跟踪统计发现,部分用户持续被QoE质差标签标记,对这部分用户进行探针拨测任务深度分析,确认与部分网站频繁质差强相关。定制http网站质差统计报表,结合省内相关手段,挖掘出网站频繁质差根因,并将相关数据呈现给前端,为省内的资源本地化引入提供数据支撑。统计标准如下。
(1)统计需求:QoE单质差标签用户的网站访问的质差率。
(2)统计口径:所有QoE单质差用户的网站访问信息,如网站名称、url、平均首页响应时长、质差次数、访问次数。
平均首页响应时长=网站url统计的平均首页响应时长
访问次数=http文件中统计的网站url被访问次数之和
质差次数=质差文件中统计的网站url质差次数之和
(3)统计公式:网站访问质量=1-(QoE质差单标签用户访问网站的质差频次/QoE质差单标签用户访问单网站的频次)×100%
根据http质差统计结果,结合省内探针分析手段,对质差网站跟踪检测,引发质差的因素主要为网页首页元素多、元素本省化率低、服务器响应慢、网站首页时延相对低于全国平均水平。
针对QoE质差用户故障定位难、修复难的问题,本文以问题为导向,通过大数据分析手段,深挖内部数据潜力,首次实现QoE质差用户的业务感知与网络故障的关联映射和对QoE质差用户的闭环管控与修复量效评估,找到了对QoE指标提升工作的有力抓手,并有效压降人工成本,为拉动政企收入提供靶向数据支撑。截至目前,QoE质差用户整体修复率达65.09%。2022年9月光宽网页访问优良率指标得分为99.2,较年初提升0.23,宽带网络质量满意度持续多季度保持行业第一。
下一阶段,我们继续践行光宽网络精细化运营的工作理念,使网络质量管控由网络事件驱动向业务感知驱动转变。加大QoE质差工单的预检预修覆盖范围;
推动实现网络事件、安全事件、网络性能数据入湖,结合用户探针与资源树数据,加强多元素联动分析力度,进一步探索光宽业务感知的快速诊测手段。■
栏目最新:
- 农村留守儿童社交焦虑的影响机制研究2024-09-18
- 扫码时代,让法治为老人留个慢窗口2024-09-18
- 心守一抹暖阳,静待一树花开2024-09-18
- 什么是低空经济2024-09-18
- 大数据环境下基于职住地识别的公交通勤...2024-09-18
- 外耳道恶性增生性外毛根鞘瘤1例2024-09-18
- 纳米金刚石及其衍生物在烃类转化中的研...2024-09-18
- 云南茂租铅锌矿床地质地球化学特征及成...2024-09-18
- 公路用胶粘剂制备与工程造价应用研究2024-09-18
- T淋巴细胞亚群检测,帮助了解你的免疫力2024-09-18