互联网技术 · 2024年2月7日

音视频/IM开发者快速定位和排查故障的方法是什么?

对于应用开发者而言,用户反馈(Feedback)是应用开发和迭代中重要的一环。开发者基于对用户反馈的收集、分析,可以进一步制订产品规划、优化产品体验、提升关键指标。对于使用网易云信服务的开发者,逐渐衍生出排查用户反馈的问题的需求。在协助开发者处理用户反馈的过程中,我们逐渐意识到开发者的痛点:

1. 用户反馈的信息具有不确定性

举个栗子,因为疫情在家上网课的用户小A向平台反馈“上课效果很卡”,平台无从得知用户反馈的卡顿是视频卡顿还是音频卡顿,是网络原因造成的卡顿还是设备配置过低无法承载,不了解发生卡顿的具体时间和当时的网络状况。用户的反馈需要联系客户逐步确认才能确认清楚,而此时网课可能已经结束了,给用户和平台都造成了损失。

2. 用户反馈的处理链路越长,处理效果越差。

过去通信类产品IM、音视频、直播问题反馈的链路往往是:用户->应用开发商->服务提供商。如果应用开发商可以自行处理用户反馈问题,这一链路将会大大缩短,提升了解决问题的效率。

3. 用户反馈的排查沟通成本较高。

由于PaaS的业务特点,问题的排查往往需要技术人员对接,甚至需要代码调试和运维操作,而直接接触用户反馈的往往是运营、产品;对负责人员的技术理解能力有很高的要求。如果有可视化的界面,将大大降低沟通成本

针对问题反馈流程中的种种难题,网易云信推出质量数据监控台,帮助跟踪用户的IM消息收发、音视频通话质量、直播流质量信息,提供端到端、可视化的自助排查工具。

通过多项关键质量数据,质量数据监控台可辅助开发者快速定位的五大类问题:网络问题、设备问题、用户行为问题、SDK问题、服务问题,提高故障排查的效率。

目前网易云信质量数据监控台的功能,分为IM即时通讯、音视频通话和直播三大类,在此我们对常见的问题排查场景重点介绍。

功能一、多维度查询用户状态与消息信息

使用云信服务过程中,最常见的用户反馈都是围绕用户状态与消息行为的。

举个栗子:

某用户反馈丢消息。实际上云信通过在线消息、离线消息、多端同步、漫游和推送等策略,保障消息必达,根据往往此类反馈可以归纳为以下几个原因:

1. 消息实际并未发送成功

2. 消息发出了,但因为消息违禁等原因并未下发

3. 接收方未登录,且没有离线消息推送

基于此我们有了初步的排查思路。借助网易云信质量数据监控台,我们按以下步骤排查:

1. 打开用户信息查询,重点关注发送方账号是否被禁用、发送方账号是否被禁言等信息。

2. 打开在线状态查询,重点关注接收方在线状态和推送token信息。

3. 查询群组和聊天室信息,对于群组或聊天室场景,可查询群组和聊天室信息作为辅助查询工具。

4.查询历史消息,根据具体时间和消息收发的账号,筛选查询用户反馈的历史消息,关注历史消息是否有违禁词

音视频/IM开发者如何准确定位、快速排查故障?音视频/IM开发者如何准确定位、快速排查故障?

基于以上查询到的信息,开发者可以基本确认消息未能收到的原因。极大地提高了排查效率。

功能二、复杂问题下发命令拉取日志信息

有时用户反馈的问题较为复杂,单纯通过信息判断不足以下结论,这种情况下我们支持拉取用户日志,由技术顾问处理。IM日志拉取页面下,可以下发日志拉取命令。当用户在线的情况下,可将相关日志上传。通过日志查询可以查询到日志详情。将相关日志提供给云信技术顾问分析,方便尽快定位问题。

使用技巧:

1. 日志拉取工具(内测)致力于帮助客户快速定位问题,用于拉取定位问题所需的用户日志;

2. 仅当终端用户在线时,方能顺利拉取日志,若出现用户不在线,可联系其上线,日志即可拉取成功;

3. 请在向技术顾问反馈问题时附上对应日志,共同提高定位问题的效率;

平台使用若遇到问题,可反馈给对应技术顾问。

功能三、音视频质量数据监控排查

通过音视频数据监控台,我们可以非常简单地识别以下几类问题:

• 设备问题,比如设备老旧、性能差、系统版本不兼容

• 网络问题,比如用户当前网络不稳定、用户环境信号差

• 用户行为问题,比如用户切换了网络、用户误触了静音

• 音视频服务器问题

为了能够帮助客户形成更全面的数据大盘,能够迅速定位到问题,我们提供了全链路的质量数据信息,包括:

• 音视频房间基础信息

• 房间内用户基础信息

• 用户的行为事件

• 音频相关数据

• 视频相关数据

下面以一个常见案例的切入点,说明一下如何使用质量数据监控台。

比如在一个在线教育房间里面,有一个学生反馈听到老师的声音不流畅,声音卡顿延续了几分钟。

关于这种常见的问题,让我们来看一下我们可以如何通过音视频质量监控台找到问题的关键点,在一分钟内给到用户一个满意的答复。

一般情况音频卡顿主要是由以下几点原因导致的:

1. 发送端上行网络丢包高;

2. 发送端CPU占用高,无法及时处理

3. 接收端CPU占用高,无法及时处理

4. 接收端下行网络丢包高

如果是CPU占用过高的问题,可以建议客户在设备上尽可能关闭其他的设备;如果是网络丢包高的问题,可以建议客户更换一个更好的网络。

音视频/IM开发者如何准确定位、快速排查故障?

网易云信的方案优势

网易云信目前已服务80万家开发者,终端用户遍及全球196个国家的7亿用户,海量用户产生的大量线上数据,网易云信进行了聚合检索上的各类优化,将海量数据以简单、便捷的方式呈现给开发者。

1. 全链路

与友商的同类产品不同,网易云信数据监控台不局限于音视频通话问题的排查,在用户登录状态、消息收发、音视频通话、直播聊天室 等多种场景均可通过数据监控台排查。使用网易云信IM、音视频通话、直播等产品的开发者均适合使用质量数据监控台。

2. 端到端

IM层面,云信提供精确到某条消息的追踪,音视频通话层面,云信提供每通通话当中,每个上行下行的端到端映射数据,不漏掉任何一个细节。

3. 可视化

常言道文不如表,表不如图,在数据可视化层面,网易云信更多采用图表呈现关键质量数据。图谱化的呈现方式大大降低了使用门槛,方便运营、产品人员快速上手。

4. 实时性

质量数据监控台支持对线上互动数据进行实时性检索,比如客户可查询当前正在进行中的音视频通话质量,基于实时上报的数据有针对性的调整各项参数,及时有效地解决用户问题。

OpenMagic API

Need more than content? Move into the product flow.

If you are here for model access, pricing, developer docs, or the future API console, the dedicated product path now lives on api.openmagic.ai.

登录免费注册