扬州城市论坛 科技 覆盖205种语言,「未有科技」想成为最懂小语种的全球AI数据服务商早期项目

覆盖205种语言,「未有科技」想成为最懂小语种的全球AI数据服务商早期项目

文 | 周鑫雨

数据是21世纪最重要的资产,语音数据则是实现人机交互、全球互通的重要基础。

成立于2019年6月,未有科技(iWillTech)是一家全球化架构的全自营AI数据服务企业,为全球人工智能企业提供语音识别、语音合成、自然语言处理、计算机视觉等领域的AI模型训练数据服务。

由于数据资源覆盖面有限、自有数据集体系不健全,目前业内大多数据公司采用的是业务外包的传统模式。但这也导致数据源不合规、数据质量低下、数据成本不可控、服务不专业等问题。与此同时,在语音领域,行业又存在小语种数据不完善、缺乏全球化运营经验等痛点。

未有科技CEO彭玉成认为,数据一定程度上已经成为限制AI发展的核心因素,而未来众多全球化应用场景的落地实现离不开全球化的数据:“数据、算法和算力被称为驱动人工智能行业的‘三驾马车’,其中,数据更是从本质上决定了人工智能的落地水平。智能办公、无人驾驶、智能座舱、游戏娱乐,甚至未来元宇宙的落地都需要海量的高质量数据,而想要训练全球化的模型则必须有全球化的数据。”

据未有科技创始人杨雪平介绍,为了解决行业痛点,相较行业普遍的外包模式,未有科技是首家采取“全自营”业务模式的数据企业。通过直接运营和管理终端数据生产用户,未有科技能够实现对数据采集、标注、质检、交付全流程的管控。未有科技目前已获得ISO27701,ISO27001以及ISO9001认证,也是国内第一家承诺价格全透明,永久保证质量的数据企业。

自创立以来,未有科技便从数据领域壁垒最高难度最大的语音数据进行切入,目前更打造了在小语种数据方面的核心竞争力,覆盖了全球205种语言,在美国、日本、新加坡、中国等地开设了运营中心,形成了覆盖亚非欧美五个大洲的区域团队,开发了涵盖60多种语言的自有数据集,并在此方面持续加大投入。

未有科技数据库覆盖语种范围。图源:受访者供图

目前,小语种数据已成为未有科技的核心优势,其拥有自有版权数据集的语种覆盖了全球80%以上的人群,正确率亦能达到99%以上。随着业务的发展,未有科技业务已逐渐渗透到自动驾驶、OCR和图像等领域,作为其业务生态的有效补充。

未有科技核心业务。图源:受访者供图

未有科技CEO彭玉成曾任甘泉资本投资总监,是清华大学苏世民学者。创始人杨雪平自2016年起就进入了数据行业,曾帮助多家人工智能和数据公司从零搭建起AI数据业务线,具有丰富的数据业务经验。未有科技的团队成员来自包括芝加哥大学、清华大学、香港理工大学、武汉大学、北京外国语大学等全球顶尖学府,拥有丰富的海外经历和资源,在数据采集、标注、分析、管理、销售等领域有较深的沉淀。

自成立以来,未有科技服务了包括字节跳动、科大讯飞、腾讯、阿里巴巴、美团、京东、大疆、小鹏汽车、Momenta、中科院、中国科学技术大学在内全球AI企业与科研机构,帮助客户部署人工智能。杨雪平认为,在未来,无论是人机交互,还是人与人之间通过科技实现的互联互通,数据都将成为基石。

本文来自网络,不代表本站立场,转载请注明出处:https://www.yzcslt.com/n/a4365.html

企业,科技,全球,语种,数据,语言,人工智能,领域,业务,行业

扬州城市论坛后续将为您提供丰富、全面的关于企业,科技,全球,语种,数据,语言,人工智能,领域,业务,行业内容,让您第一时间了解到关于企业,科技,全球,语种,数据,语言,人工智能,领域,业务,行业的热门信息。小编将持续从百度新闻、搜狗百科、微博热搜、知乎热门问答以及部分合作站点渠道收集和补充完善信息。