新技术或者新现象的出现总会引发人们的热议,尤其是针对它可能产生的影响和未来的发展。人工智能生成内容(AIGC)同样如此,在ChatGPT到来之前,人们似乎没有怎么听过AIGC这个词,它为什么会一夜之间“爆火”呢?如今国内对其探索方向如何?对此,我们或许能从国内独角兽企业云知声的发展得到答案。
正所谓“外行看热闹,内行看门道”。现在沸沸扬扬、热热闹闹的AIGC对于人工智能领域中的业内人士来说,并不是一个陌生词汇。
近期AIGC的“火爆”其实是因为三个方面的原因,产品层面来说,ChatGPT做了一个非常巧妙的举动,它把生成式的应用包装做成了对话式应用,并且免费开放给用户使用,降低了使用门槛的同时,扩大了用户群体。在概念层面,ChatGPT把原来专业的名称——超大规模预训练模型,改成了简单易懂的通俗名称——ChatGPT,降低了传播门槛。技术层面来说,ChatGPT在经历了长期的投入和跟进之后,确实有很好的应用效果,而且这种效果可以好到让普通人为之兴奋。
对于AIGC,一种是基于通用大模型提供服务的公司。它们通过通用大模型底座对外提供服务,从而获取规模性的用户。这种服务的成本会很低,导致售价也非常低,形成模型的飞轮,进而形成一个壁垒。当这些壁垒形成以后,后来者的大模型哪怕做得再好,也会因为“白菜价”的存在,很难快速获取巨量用户群体来反哺大模型的投入,形成可持续的商业模式。
另一种是基于垂直场景大模型提供精细化服务的公司。我们坚信通用的大模型并不能解决各个垂直领域的所有问题,哪怕他在技术上解决掉,他在真正的应用过程里会有很多的know-how,很多行业的壁垒。这些壁垒必须有专业的公司去进行服务,且不能通过通用大模型去解决,那通过什么呢——垂直的,但还没有那么大的大模型。可能一开始不会到千亿参数,但一定会在几百亿规模。然后,再形成规模性的客户,获取到足够的数据,在获取数据提供服务的整个过程里,这个场景会非常注重它的可控性,这种可控性不仅仅是数据本身的可控性,也有服务的可控性,最后会形成一个面向垂直场景来提供服务的公司,这类公司可能在每个垂直领域都会有几家,这也是广大 AI从业者的比较好的一个机会。
成立于2012年,云知声拥有自研的技术架构,包括自建的智算中心、全栈式算法,以及海量的数据,云知声基于此打造云知大模型——一开始是用AI1.0的方式在做,现在正将其进化到预训练大模型。云知声下游覆盖智慧物联与智慧医疗两大场景,未来会从智慧医疗入手,应用我们的大模型,面向医院、医生及医管部门,提供AI医学大脑。
那么,ChatGPT在医疗场景有哪些用途呢?ChatGPT的回答是:医疗问答、聊天机器人、疾病诊断、医学文献检索、患者跟踪等,归根结底,它也是在做虚拟医生。云知声的主要工作重心就是解决大模型在垂直场景落地的这些具体的局限。例如,云知声会做行业知识的增强以解决“幻觉”的问题,会做企业检索的增强、API的增强、微型化以及IO审查,所有这些问题都是可解的,都会在有限的时间内解决。
在这个基础上,云知声会推出面向医疗行业的行业版大模型,并在行业之上,面向客户提供企业定制版大模型。从16年进入医疗行业以来,云知声经过多年积累,在数据层面、在大模型以及知识图谱方面都取得了一定的进展和成效,有一个非常好的起点。云知声的愿景,就是从医疗版着手,逐步覆盖到其他专业版,最后把各个专业版联合起来,基于MoE(Mixture of Experts)技术做模型集成,训练得到通用增强版。
以前AIGC是一层“迷雾”,很多企业都看不清未来前进的道路和方向,而现在迷雾消散了,一条跑通的道路展现在所有人眼前,当下正是要坚定信心往前冲的时候。期待云知声等深耕AI的企业能持续发展企业优势,在AIGC道路上下求索,迎接新时代。
【广告】