在被OpenAI的ChatGPT成功搅动热情、却又猝不及防开始封亚洲账号的日子里,阿里云自研大模型开始邀测。
TechWeb获得测试码并第一时间连夜进行了测试体验,包括常规问答、写剧本、写商品文案、写编程代码、进行SWOT分析、做数学题、甚至写“彩虹屁”文……整体而言,有惊喜也有惊讶。
这款阿里版ChatGPT“通义千问”实力究竟如何?一起看看。
有意思的是,通义千问还单独弄了一个“百宝袋”,目前有“9宫格”小应用。稍后依次试试看。
体验开始
一、常规问答
作为一个AI预训练语言大模型,问答“对话”是基本技能。
当然,开始之前,也要知己知彼。
于是我们先请它做了一个自我介绍:
追问1:“为什么你的名字叫通义千问?”
答:“通义千问”这个名字来源于两个方面,“通义”意味着该模型具有广泛的知识和普适性,可以理解和回答各种领域的问题。作为一个大型预训练语言模型,“通义千问”在训练过程中学习了大量的文本数据,从而具备了跨领域的知识和语言理解能力。“千问”代表了模型可以回答各种问题,包括常见的、复杂的甚至是少见的问题。它表达了通义千问致力于满足用户在不同场景下的需求,无论问题多么复杂或者独特。综合起来,“通义千问”这个名字表达了这款人工智能语言模型的强大功能和广泛适用性。
二、单项文本测试
1、写剧本
我们让通义千问:写一个《流浪地球3》的电影剧本
通义千问的《流浪地球3》电影剧本如下:
第一幕
[字幕:2023年,地球遇到了危机。太阳即将毁灭,人类必须寻找新的家园。]
场景:地球表面
[字幕:空间站船员正在紧急磋商,制定新的逃生计划。]
船员1:我们必须尽快行动,否则就来不及了。
船员2:我们已经尽力了,但是我们的引擎已经到达极限。
船长:我们必须寻找新的家园,这是我们唯一的希望。
[画面切换到地球上的各个角落,展示着严峻的环境和危机。]
场景:南极洲
[字幕:人类正在南极洲建造一个新的据点,以便在太阳毁灭之前寻找到新的生存空间。]
工程师:我们必须加快速度,否则我们就来不及完成了。
建筑工人:我们会努力的,我们必须要为人类的未来而战斗。
[画面切换到其他地球上的角落,展示着人类为了生存而做出的努力。]
场景:北极
[字幕:人类正在北极周围建造巨大的冰盾,以保护地球免受太阳辐射的影响。]
科学家:我们正在研究新的能源技术,这将是我们新的生命线。
船员:我们必须相信人类的智慧和勇气,我们一定能够度过这个难关。
[画面切换到地球上的其他地方,展示着人类的不屈不挠和对未来的希望。]
场景:大气层外
[字幕:人类最终成功地建造了能够逃离太阳系的太空船,并发射了它。]
船长:我们成功了!我们将在外太空中寻找新的家园。
[画面切换到太空中,展示着人类的新家园。]
场景:外太空
[字幕:人类在外太空中探索着新的星球,并开始建立新的文明。]
太空人:我们已经找到了一个新的星球,我们将在那里建立新的家园。
船员:这是我们新的历程,我们将永远不忘我们所经历的一切。
[字幕:《流浪地球3》结束,人类将继续前行,寻找新的生存空间。]
场景换得挺多,大家觉得如何?
2、做助理
五一假期马上就要到了,让通义千问帮我们做一个五一假期北京5日游的旅游计划。
通义千问给出了它的计划安排。如图中红线部分,它安排了第二天和第四天都要去游览颐和园和圆明园。
看来,要么是通义千问非常喜欢颐和园和圆明园,要么就是北京没必要花5天时间游。
3、商品描述生成
给了2个跟苹果相关的需求,一个是“给苹果电脑写一个商品描述文案”,一个是给“自产苹果写一个商品描述文案”。
通义千问准确理解了不同的“苹果”,并都给出了很不错的回答。看来,通义千问做商品文案小助手的能力还是很娴熟的。
4、SWOT分析
让通义千问帮忙分析一下“特斯拉和比亚迪哪一家强”。
5、彩虹屁测试
我们让通义千问分别夸一夸 “马云”和“马化腾”。
6、小学生作文测试
给通义千问提了一个“我的爸爸”的小学命题作文要求。
然后我们把通义千问写的作文,给了正在读小学的小学生看,他表示:作文有小学3年级水平。
7、数学能力测试
我们给通义千问出了道小学数学题,“哥哥比弟弟大3岁,哥哥今年9岁,弟弟几岁?”从回答来看,通义千问貌似把自己给绕晕了。
总结:
看完上面的体验,你给通义千问打几分?
邀测中的“通义千问”仅仅是一个前菜,阿里云将在 4月11 日召开阿里云峰会,据说到时候会有大餐推出。
无论如何,期待国内的大模型能做大做强!用自己家的,也不怕封号!