当前位置: 电话机 >> 电话机介绍 >> 科大讯飞和他们的1024
作者
深水财经社赵士勇
尽管这波新冠疫情传播仍未消散,但是科大讯飞全球开发者节在推迟一个月之后,仍然坚持开幕了。开幕式原定的公历10月24日,变成农历10月24日。
在开幕式上,即便是妙语连珠、身经百战的合肥市委书记虞爱华,也激动得差点忘记宣布大会开幕的环节。
无论对于合肥市,还是对于科大讯飞公司,他们实在舍不得放弃这个安利的机会。
科大讯飞一直是合肥的重要城市名片,而现在,合肥市类似于科大讯飞这样的名片已经越来越多。科大讯飞董事长刘庆峰的演讲主题是“因为看见,所以坚信”。因为他们要让所有人看到合肥市在培育科创产业方面取得的成果,也要让所有人知道科大讯飞在AI领域树立的领军地位。
语音智能,讯飞的艰苦蜕变
科大讯飞是什么公司?他们是如何走到现在的?
很多人都知道,科大讯飞是靠做语音识别和语音合成起家。年,刘庆峰等人从中国科技大学人机语音通信实验室走出,创办了科大讯飞,并在年成为国内第一家大学生创业上市公司。
在最开始的语音识别,主要靠关键词,比如银行的电话机器人,让你说出某个业务关键词,机器人就会自动切换到某个业务的客服坐席,或者由机器人给你做业务介绍。
最开始的机器人只能识别固定的几个关键词,而且必须用普通话,如果你用广东话或河南话讲,或者吐字不清楚,机器人就懵逼了,他只会不断得让你“请再说一次”。
但是这种语音识别的门槛是很低的,带来的业务收入也不是很多,所以讯飞在头十年里,一直是以一个概念股出现,盈利寥寥,估值高企,大部分靠政府补贴,还存在较高的研发资本化率。当时讯飞的主要盈利来源是靠给其他互联网公司或政府、金融机构打工,是他们的技术外包服务商。
直到讯飞开发出了语音输入法,他们才算真正掌握了语音识别的核心技术,也算是进入语音识别领域的大门,这也是讯飞开发出的第一款真正意义的C端应用产品。
语音输入法是一个你说话后机器同步识别然后转化成文字的技术,靠什么呢?就是靠给声纹打标签,可能有几十亿上百亿个标签样本,同一个字词按照不同语种、方言可能有几百上千种发音方式,通过不断积累这些标签,机器听到你的说话后,会迅速与云端的标签库匹配,然后实时识别出你说的话是哪一个字,哪一个词组,因为有足够多的标签样本,机器还可以联想、修正你的话,提高准确率和反应速度。
这个阶段的技术,其实还是一种机械的关键词匹配,机器还是不能理解的,离人工智能还差得很远,而拥有这种语音识别技术的国内公司也很多,几家互联网大厂都有自己的消费级应用。
但是科大讯飞的语音识别技术的高识别率、低差错率、高反应速度,应该在国内是名列前茅,而每次讯飞开大会,董事长刘庆峰一定会安排上实时语音识别,现场媒体记者可以快速拿到讲话稿,这也让速记员直接下岗。
之后,讯飞陆续开发了翻译机、助听器、学习机、办公本等消费级硬件产品,算是真正意义从一家技术外包公司变成一家互联网科技公司。
而科大讯飞也开始摆脱曲高和寡的窘境,在教育、政法、智慧城市、智慧办公和消费级硬件产品方面找到应用场景,并迅速打开市场,业绩开启了高速增长时代。
在教育领域,目前,讯飞智慧教育产品已在全国32个省级行政单位以及日本、新加坡等海外市场应用,同时构建了面向G端、B端和C端三类客户的业务体系。
在医疗领域,科大讯飞通过通过医学语义计算、语言理解、知识推理、医学数据挖掘分析等核心技术,实现面向基层医生的全科辅助诊断服务。科大讯飞研发的医考机器人在年国家执业医师资格考试笔试中,以总分分通过考试,超过全国96.3%的考生,成为全球唯一一个通过国家执业医师资格考试笔试测试的人工智能系统,目前这种医考机器人已经在医疗机构中实现规模化应用。
曾经,刘庆峰在科大讯飞年会上喊出的“人工智能红利兑现”,终于有了这些应用场景的打底,科大讯飞等待的是下一个跃升。
超脑计划,国产虚拟人狂想曲
“当你们看到我们在教育、医疗、智慧城市这些展馆上的各种成果,我想大家对未来不仅仅是带着理想的相信,而是因为看见,所以我们相信人工智能和中国科学广阔的未来。”在今年的全球开发者节上,刘庆峰的表达更加自信。
今年10月,特斯拉创始人马斯克研制的eslaBot人形机器人擎天柱(Optimus)原型机开始全球首秀,引爆AI人工智能的新一轮热潮。
对于国人来说,擎天柱是美式科幻的标志,马斯克用他那无限的脑洞,给世界带来强烈的感官冲击。
但是马斯克并不孤独,也并做不到求败。因为在中国,已经有很多创业者在AI人工智能领域暗自生长。
总体来说,机器人的核心技术有两大系统,一是硬件方面,即关节系统,如动力、减速、驱动、新材料工艺等等,简单说就是机器人的骨架;二是软件方面,即机器人系统,如视觉、听觉、触觉、嗅觉等仿生感知系统,以及大脑也就是认知系统。
如果说硬件还可以模仿和发明,但是如何做到人机耦合,将硬件系统和软件系统集成为一个体系,这是才是人工智能的集大成者,而科大讯飞目前正在完成最艰难的突破。
在今年年初,科大讯飞正式发布了“讯飞超脑计划”,在今年的科大讯飞开发者节,数十款AI应用已经出现在合肥奥体中心的展馆里,嘉宾与这些AI虚拟人已经可以流利的交互交流,机器狗们也可以实现工业巡检等功能。
科大讯飞董事长刘庆峰
刘庆峰介绍,人工智能最核心的几个问题,目前科大讯飞都获得了突破性进展,从语音感知,到视觉、眼神、面部表情、肢体语言、味觉触觉、环境的综合感知,再到深度的理解和学习能力、虚拟形象、配合运动等等,每一项进展都可以在今年的科博展感受到。
以门槛最高的深度理解为例,斯坦福大学牵头的SQuAD的比赛中,10万篇来自于维基百科的英文文章,人看了以后提问题,由科大讯飞的机器回答问题,他们的机器阅读理解能力已经超过人类平均水平,这就使得机器可以在应用在医疗、教育领域。
而在世界最权威的艾伦研究院组织的OpenBookQA知识推理大赛中,科大讯飞的AI机器人已经首次超过人类水平,这标志着科大讯飞在认知智能方面的重大突破。
元宇宙是人工智能的集大成者,在今年讯飞的人工智能展馆中,自然人与虚拟人已经不再用笨拙艰难的工具来操纵,而是可以很自然的对话交流。而“讯飞超脑计划”的第一阶段,就是将在年首发专业虚拟人,年打造数字经济下的虚拟人家族。
如今,讯飞AI虚拟人已在医疗、金融、媒体、文旅等多个行业上岗,亮相两会、北京冬奥会、世界人工智能大会等多个重要场合,讯飞首个AI虚拟歌手LUYA也在近期正式出道。
虚拟人如果能够突破,那么接下来科大讯飞的“擎天柱”就将很快横空出世。
“凭借我们软硬一体化的能力,我们将会推动软硬一体机器人进入家庭,首先是可养成的宠物,机器狗宠物等等这些,可养成玩具进入家庭,包括我们在今年年初宣布,明年我们要推出抑郁症的AI的全自动排查平台,然后要进入到自适应行走的外骨骼机器人,在我们的展厅上也能看到相关技术的进展,让他能够帮助到每一个老人。”刘庆峰在开发者节上表示,“最后我们会让懂知识、会学习、能陪伴的机器人进入每个家庭。”
构建生态,方能生生不息
人工智能是一个系统,而作为以语音识别交互起家的科大讯飞来说,仅靠自身团队的力量很难支撑如此庞大的工程,构建全球开发生态,整合全球开发者资源,才是科大讯飞的终极目标,也是一个可持续发展的模式。
从年开始,讯飞的全球开发者节已经举办了六届,这个大会从创立之初,就提出了以人工智能技术为依托,以“开放、合作、生态、共享”为主理念,以全球智能开发者为对象,吸引全球各地的AI专家、企业家、开发者,致力于发扬双创精神,扶持AI行业开发者、创业者,建立健全AI产业链,最终形成健康、可持续的人工智能产业生态。
在首届大会上,彼时科大讯飞执行总裁胡郁发布了科大讯飞计划,包括AI生态计划、AI教引计划、AI公益计划三部分。
在当时的市场中,科大讯飞的宏伟蓝图尽管响亮,也让众人想入非非,但是他们能否担当起这个重任,外界实际上持谨慎乐观态度。
可能有些人也没有想到,讯飞可以把全球开发者节越做越大,越做越红火,以至于即便在新冠疫情之下,他们也没有停办,这既有合肥市的力挺,更有刘庆峰们的执着。
早在年,科大讯飞就首次发布以智能语音和人机交互为核心的人工智能开放平台——讯飞开放平台,为开发者提供一站式人工智能解决方案,这在当时说,是颇具野心的计划,毕竟当时的讯飞在语音识别还在步履蹒跚,甚至当时连语音客服电话都还是稀罕物。
年的开发者节上,科大讯飞正式发布了开放平台2.0战略,这个平台进一步扩大了自己的“朋友圈”结构,由过去的“讯飞+开发者”结构扩大为“讯飞+各个行业的龙头、专家+开发者”结构。
但是经过12年的积累,科大讯飞的开放平台已经开放项AI产品及能力,聚集超过万开发者团队,总应用数超过.6万,累计覆盖终端设备数超过36.6亿,AI大学堂学员总量达到69.9万,链接超过万生态伙伴。
而在年的全球开发者大赛中,参赛团队人数从支增长到了支,增长了44%,其中增长最快的是工业互联网团队,增加了达到了多个,而虚拟现实、元宇宙方向达到了多个,增长了好几倍。
更令人欣喜的是,95后的Z时代正在成为AI开发者的主角,参加算法组比赛的个赛道72个算法赛,平均参赛年龄只有26.5岁。
“今天的Z世代,95后的年轻人
转载请注明:http://www.aideyishus.com/lkyy/3977.html