Meta推出新的AI模型 可转录和翻译近百种语言
时间:2023-08-23 08:56:00 来源:财联社
当地时间周二(8月22日),Meta发布了一个名为SeamlessM4T的人工智能(AI)模型,可以翻译和转录近百种语言。
(资料图片仅供参考)
据Meta介绍,SeamlessM4T可以翻译近100种语言的语音到文本和文本到文本。对于语音转语音和文本转语音的操作,它可以识别100种输入语言,并将其转换为35种输出语言。
SeamlessM4T是根据知识共享许可(CC) 协议4.0发布的,允许研究人员对其进行迭代。
除了SeamlessM4T,Meta还发布了其开放翻译数据集SeamlessAlign的元数据。
Meta表示:“建立一个通用语言翻译器,例如像《银河系漫游指南》中虚构的巴别鱼那样,是具有挑战性的,因为现有的语音对语音和语音对文本系统只覆盖了世界语言的一小部分。”
《银河系漫游指南》是由英国作家道格拉斯·亚当斯所写的一系列科幻小说,而巴别鱼是这部作品所创造的一种神奇生物,体型小到足以放进人的耳朵,靠接受脑电波为生。如果将巴别鱼放到耳朵里,人们可以理解任何语言。
对于SeamlessM4T模型,Meta研究人员在一篇研究论文中表示,他们从400万小时的原始音频中收集了音频训练数据,这些音频来自一个公开的抓取网络数据存储库,但没有说明是哪个存储库。
研究报告称,文本数据来自去年创建的数据集,这些数据集从维基百科和相关网站上提取了内容。
Meta表示,SeamlessM4T代表了一个重大突破,因为这个模型可以一次性完成整个翻译任务,而不像其他大型翻译模型那样,将翻译分成不同的系统。
SeamlessM4T建立在Meta之前的翻译模型之上。Meta去年发布了支持200种语言的文本到文本的翻译模型。它开发了用于多语言语音到语音翻译的数据集,以及用于语音识别的大规模多语言语音。Meta去年展示了它的通用语音翻译器,可将闽南语转化为英语。
(来源:财联社)
标签:
最新文章推荐
- 陕西7名核酸检测阳性外省游客活动轨迹公布
- 万人说新疆 | 棉花朵朵赛白云,阿克苏美出新高度!
- 万人说新疆 | 孙芳红:我在新疆每天过得很充实也很快乐
- 万人说新疆 | 棉农阿卜来提开心地笑了
- 万人说新疆 | 阿迪力的棉花合作社年入300万
- 四川乐山犍为县发生4.3级地震 无人员伤亡
- 西安全面开展排查管控 目前20481人核酸检测结果均阴性
- 陕西7名核检阳性者为一旅行团同行人员 活动轨迹公布
- 西安交大举行2021级本科生迎新会 校长:学习是主动作为之事
- 【母亲河畔的中国】黄河岸边的这个村庄如何打好旅游服务牌?
X 关闭
资讯中心

2022-08-06

2022-07-08

2022-05-20
2021-10-18
X 关闭
热点资讯
-
1
Meta推出新的AI模型 可转录和翻译近百种语言
-
2
赛伍技术:融资净偿还438.55万元,融资余额2.94亿元(08-22)
-
3
飘窗这样改,家里多出一间房,2平当4平用
-
4
优甲乐效果虽好,但要警惕5个副作用,希望了解清楚
-
5
中国软件国际(00354):杨德斌获委任为独立非执行董事
-
6
海看股份:关于公司的业务经营与战略布局请关注公司后续在指定信披媒体发布的定期报告
-
7
国防部长李尚福会见阿联酋空军和防空军司令
-
8
上海机场、白云机场股价跌出两年新低 免税业务对机场业绩影响到底有多大?
-
9
8月25日,河南普通高招高职高专批将再次征集志愿
-
10
成为专业游戏原画师必须要具备的素质有哪些呢?
-
11
靖远县博物馆推进国家公共文化服务体系示范区创新发展开展暑期研学活动
-
12
华润电力(00836.HK)发布中期业绩 股东应占溢利67.4亿港元 同比增加54.24% 拟派发中期股息每股0.328港元
-
13
定档9·20 腾讯游戏x育碧首款3A射击大作《全境封锁2》国服预约正式开启!
-
14
二手交易平台乱象调查:网络欺诈真假混卖现象层出不穷
-
15
北京东六环改造工程盾构隧道双线贯通
-
16
西藏山南市开展涉疫药品和医疗用品稳价保质专项行动
-
17
华明装备:变压器能效等级替换预计将会对公司带来比较正面的影响
-
18
电视收费不能让套路 挡住出路
-
19
微信怎么设置红包提醒功能苹果手机(微信怎么设置红包提醒)
-
20
《谈人生真正幸福》山林子谈人生系列组诗之三零零