کمپانی متا به تازگی از مدلهای هوش مصنوعی جدیدی رونمایی کرده است که توانایی شناسایی و تولید گفتار را در بیش از 1000 زبان دارند. این عدد چیزی حدود 10 برابر بیشتر از چیزیست که اکنون در اختیار ماست. متا در این مورد گفته است که ساخت این هوش مصنوعی قدم بزرگی در راستای زنده نگاه داشتن زبانهاییست که امروزه در خطر نابودی قرار گرفتهاند.
متا در حرکتی قابل تقدیر، این مدلها را از طریق سرویس میزبانی کدِ GitHub در اختیار عموم قرار داده است. بر اساس ادعای متا، متن باز کردن این مدلهای هوش مصنوعی به توسعهدهندگانی که با زبانهای مختلف کار میکنند اجازه میدهد تا کاربردهای زبانی جدیدی ایجاد کنند؛ برای مثال سرویسهای پیامرسانی که با هر زبانی قادر خواهید بود تا در آنها به سایر افراد پیام بدهید یا سرویسهای واقعیت مجازی که با هر زبانی توانایی استفاده از آنها را خواهید داشت.
حدود 7000 زبان در دنیا وجود دارد، اما مدلهای شناسایی گفتار کنونی فقط قابلیت درک حدود 100 زبان از این بین را دارند. یکی از دلایل پایین بودن این عدد، نیاز این مدلها به مقدار زیاد اطلاعات در زبان مقصد برای یادگیری آن زبان است، چیزی که فقط در زبانهای کمی دیده میشود؛ زبانهایی مانند انگلیسی، اسپانیایی و چینی.
پژوهشگران متا این مشکل را با بازطراحی یک مدل هوش مصنوعی قدیمیتر که توسط متا در سال 2020 طراحی شده بود حل کردند. این مدل قادر است تا الگوهای گفتار را از طریق صوت و بدون نیاز به اطلاعات نشاندار بسیار زیاد تشخیص دهد و فرا بگیرد.
پژوهشگران این هوش مصنوعی را با دو مجموعه اطلاعاتی تمرین دادند: نخست، مجموعه ضبط شدهی انجیل عهد جدید و متون متناظر با آن که در 1107 زبان از بستر اینترنت فراهم آمد، و دوم، مجموعه ضبط شدهی انجیل عهد جدید بدون متن متناظر در 3809 زبان.
مایکل آئولی، یکی از پژوهشگرانی که عضوی از این پروژه بوده در این مورد گفت: “ما میتوانیم از چیزهایی که این مدل آموخته برای ساخت سیستمهای زبانی با اطلاعات قبلی خیلی کم استفاده کنیم. زبانهایی مثل انگلیسی، مجموعه اطلاعات ارزشمند بسیار زیادی دارند که میتوانیم از آنها برای ایجاد مدل زبانی استفاده کنیم، اما چنین چیزی برای زبانی که فقط 1000 نفر از آن استفاده میکنند در دسترس نیست!”
این پژوهشگران میگویند که مدلهای آنها میتواند 4000 زبان را شناسایی کند و 1000 زبان را در مکالمه به کار ببرد. آنها همچنین ادعا میکنند که مدلهای خود را با سایر مدلهای رقیب در بازار مانند Whisper که محصول کمپانی OpenAI است مقایسه کردهاند و نتایج نشان میدهد که مدلهای متا علاوه بر اینکه 11 برابر زبانهای بیشتری را پوشش میدهند، میزان خطایی نصف بقیه دارند.
البته نگرانیهایی نیز در مورد این مدلهای زبانی وجود دارند؛ کریس امزوئه، یکی از پژوهشگران حوزهی زبان طبیعی در هوش مصنوعی برای زبانهای آفریقایی، بیان کرده است که استفاده از انجیل به عنوان یک متن مذهبی برای ایجاد یک مدل زبانی، ممکن است باعث ایجاد خطا در ان شود. اکنون باید منتظر ماند و دید آیا این استراتژی جدید از سمت متا، مورد قبول جامعه جهانی قرار خواهد گرفت یا خیر.
به نظر شما آیا مدلهای زبانی هوش مصنوعی متا، در نهایت افراد را از یادگیری زبان خارجی بینیاز خواهد کرد؟ نظرات خود را با ما در میان بگذارید.
هوش مصنوعی جدید متا، توانایی شناسایی و تولید گفتار در بیش از 1000 زبان را دارد!
واحد رسانه بارسلون
برای نوشتن دیدگاه باید وارد بشوید.