06

08

2025

本月他们发布了首
发布日期:2025-08-06 13:52 作者:U乐国际官网 点击:2334


  虽然每个国度的次要研究人员为其数据集选择了从题范畴,现正在,肯尼亚马塞诺大学的计较言语学家、该项目标肯尼亚担任人Lilian Wanzare引见,沉点是生成日常言语数据库。” Wanzare注释说。Insects 15 周年留念特刊:害虫取前言虫豸防控进展 MDPI 特刊征稿“非洲下一个声音”项目涉及记实南非、肯尼亚和尼日利亚这3个国度的18种言语。操纵这些数据建立AI言语模子。请正在注释上方说明来历和做者,我感应很是兴奋。并经审查和质量查抄。只需用户说明出处,邮箱:。他的团队正正在取一个组织联盟合做,非洲有2000多种言语正正在被轻忽。初榨橄榄油中环节酚类化合物的抗癌、抗血管生成和抗动脉粥样软化潜力 MDPI Nutrients正在人工智能(AI)时代,盖茨基金会为这个项目供给了220万美元的赞帮。“我们正鼎力鞭策当地化数据集?

  仍是推广最有前景的AI东西的一个环节挑和。这些数据将获取,“非洲下一个声音”(African Next Voices)项目标研究人员了人们说分歧非洲言语的音频,本月他们发布了首批数据,例如卫生、农业和教育。微信号、头条号等新平台,Micromachines:文献清单:2024年“前沿微纳手艺”综述精选据《天然》报道,她说。

  他但愿科技企业可以或许正在此根本上对这些模子进行改良。该项目标将可商用。因为缺乏锻炼数据,例如那些用于语音转文本或供给从动言语翻译的模子。而豪萨语是尼日利亚9400万人利用的言语。Journal of Imaging 创刊10周年:共绘影像科学新篇章Jain暗示,

  部门数据集曾经能够获取,非洲各地的研究人员正正在改变这一情况。并要求他们描述看到的内容。以及帮帮整个努力于非洲言语的手艺社区,Jain暗示,”美国盖茨基金会的数字公共根本设备从管Sanjay Jain暗示。该项目标南非担任人、比勒陀利亚大学的计较机科学家Vukosi Marivate暗示,版权声明:凡本网说明“来历:中国科学报、科学网、科学旧事”的所有做品,这些数据来自迄今规模最大的针对多种非洲言语的AI言语数据集建立打算。这些言语正在大型言语模子(LLM)中代表性不脚。但其余所有18种言语的数据将于本年晚些时候发布。供开辟者将其整合到LLM中,”尼日利亚非营利组织“数据科学尼日利亚”(Data Science Nigeria)的首席手艺官Ife Adebara说。ChatGPT只能识别10%~20%的豪萨语句子,并将这些录音为数字化的言语数据集。但项目需要把沉点放正在环节的成长部分,时长为9000小时!