互联网资讯 · 2026年4月24日

智能导航决策功能升级

4月24日,高德地图推出“AI伴行”产品。该产品能够理解用户语言,实时感知用户的位置、方向和周边环境,通过摄像头理解街景,并结合地图数据给出相关建议。

例如,用户询问“我该往哪边走”时,AI伴行会根据用户的朝向和周围地标回答:“朝右手边那个麦当劳的方向走。”系统将方向转化为可见的参照物,降低理解成本。

AI伴行支持视觉识别场景。用户在街区或历史建筑前举起手机,询问“这栋建筑讲讲”,系统会识别建筑,并结合地理位置提供历史信息、开放时间、门票情况等,同时提供前往入口的导航选项。用户也可以通过拍照获取店铺的评分、人均消费和招牌菜等信息。

高德为AI伴行构建了一套以Agent为核心的技术体系,主要包括时空上下文感知、多模态融合理解、空间行动能力和复杂任务处理机制。

在时空上下文感知方面,AI伴行在一个持续更新的时空上下文中运行,实时感知用户的位置、行进方向、导航进度和周边环境,持续更新空间、时间、环境和行为等信息。当用户提问时,这些信息参与AI推理,使系统能够准确理解“前面”“左边”“顺路”等表达。

多模态融合能力的提升使AI伴行能够同时融合文本、语音、视觉和位置信息,对用户所处的场景形成整体理解。例如,用户对着建筑说“这栋建筑真壮观,给我讲讲”时,系统结合语音内容、摄像头画面和位置信息识别建筑并提供相关介绍。

AI伴行可以调动地图能力完成具体操作,例如规划路线、发起导航、在地图上标注推荐地点,或根据用户需求实时调整路径,结合用户位置进行主动提示。

在复杂任务处理机制上,AI伴行内置“龙虾模式”,能够将包含多个条件的需求拆解为不同步骤,并调动相应能力逐步完成。例如,用户提出“在双井附近找一家评分4.5以上、人均100元以内的淮扬菜,饭后还能遛弯”,系统会先筛选符合条件的餐厅,再寻找适合散步的公园,并将相关地点和路线展示在地图上。

这一能力依托于QwenPaw任务处理框架,通过调动搜索、路线规划、视觉识别等工具,并在多轮对话中记录用户需求,使AI能够逐步完成复杂任务。

OpenMagic API

Need more than content? Move into the product flow.

If you are here for model access, pricing, developer docs, or the future API console, the dedicated product path now lives on api.openmagic.ai.