信息技术

您当前的位置: 首页  >  探索发现  >  信息技术
智谱携清言视频通话功能亮相2024服贸会 开启AI新体验
发布时间:2024-09-12     作者:   来源:新华网   分享到:

9月12日至9月16日,2024年中国国际服务贸易交易会(服贸会)在国家会议中心和首钢园区举办,本届服贸会的主题是“全球服务,互惠共享”。在北京首钢会展中心2号馆,智谱展示了多款最新产品,包括旗下清言App近期推出的“视频通话”功能、清影AI生成视频功能,以及大模型开放平台bigmodel.cn等,诸多AI科技亮相引发广泛关注。

  清言作为首批上线的C端大模型产品,过去一年中以文字和语音形式与用户互动。如今,清言迎来重大升级,解锁了“眼睛”,这是首个面向大众用户开放的视频通话功能,让用户体验到前沿的AI/大模型技术,正式进入视频通话时代。

16.jpg

  清言视频通话功能跨越文本、音频和视频三大模态,具备实时推理能力。用户可以打开摄像头,通过视频通话窗口与清言交流,清言不仅能“看”到用户画面,还能听懂指令并准确执行。即使用户频繁打断,清言也能迅速反应,带来如同真人视频通话的流畅体验。另外可以用右下角小画笔在画面上划重点,清言可以知道你着重让它看的地方是哪。

  使用方法也十分简单,只需下载智谱清言APP, 点击右下角的通话按钮,进去之后再切换到视频,就能开启一个全新的世界与小智愉快畅谈。


17.png


  清言视频通话功能可以成为生活、学习和工作中的得力助手。在生活方面,小智可以提供穿搭技巧、机器的使用方法、识别场景讲述背景故事。

  当大语言模型解锁了“看见”和“说话”的能力,AI在学习和生活中的应用更广泛了。

  首先,清言变身成了一位随身的英语翻译,以及能够随时随地开展情景教学的英语老师。清言不仅能够即时翻译中英文,还能根据用户所处的环境信息进行英语对话,并且协助纠正用户的语音和语法错误。

  其次,清言还可以是孩子们的“大眼百科”。孩子们可以用视频拍摄环境,并且让清言解释环境中陌生的物体叫什么、能做什么、英语怎么说等等。此外,清言还可以为孩子们阅读绘本故事、玩你画我猜等游戏,成为孩子们益智启蒙的最佳玩伴。

  当然,有了视频通话功能后,清言还可以成为旅游时随时讲解景点故事的导游,也能为视障人士提供识别环境的帮助。还有更多场景和功能,等待大家一同发现。

  除了视频通话功能,智谱近期推出的视频生成模型CogVideoX以及在智谱清言App上线的“清影”功能也吸引了不少观众驻足打卡。据了解,清影面向所有用户开放,只需输入文本或上传图片,30秒内即可生成6秒视频。今年7月,清影上线清言App,六天时间用户生成超过100万支视频。

  最近一段时间,智谱堪称技术动作最密集的大模型公司之一。一周前,智谱刚刚在KDD上发布了升级版基座大模型GLM-4-Plus,以及CogView-3-Plus和CogVLM在内的多模态模型,展示智谱对图像、视频等更多模态方面的研究进展,这正是业界公认的大模型的下一步。同时,类GPT-4o的视频通话功能在C端产品智谱清言上率先上线。7月,智谱生视频功能清影Ying上线智谱清言,并很快将其背后的生视频模型 CogVideoX 开源。通过大模型链接物理世界亿级用户,智谱致力于为千行百业带来持续创新与变革,加速迈向通用人工智能时代。


【我们尊重原创,也注重分享。版权原作者所有,如有侵犯您的权益请及时联系,我们将第一时间删除。分享内容不代表本网观点,仅供参考。】