هوش مصنوعی جدید متا، توانایی شناسایی و تولید گفتار در بیش از 1000 زبان را دارد!

مدل‌های هوش مصنوعی جدید متا

کمپانی متا به تازگی از مدل‌های هوش مصنوعی جدیدی رونمایی کرده است که توانایی شناسایی و تولید گفتار را در بیش از 1000 زبان دارند. این عدد چیزی حدود 10 برابر بیشتر از چیزیست که اکنون در اختیار ماست. متا در این مورد گفته است که ساخت این هوش مصنوعی قدم بزرگی در راستای زنده نگاه داشتن زبان‌هاییست که امروزه در خطر نابودی قرار گرفته‌اند.
متا در حرکتی قابل تقدیر، این مدل‌ها را از طریق سرویس میزبانی کدِ GitHub در اختیار عموم قرار داده است. بر اساس ادعای متا، متن باز کردن این مدل‌های هوش مصنوعی به توسعه‌دهندگانی که با زبان‌های مختلف کار می‌کنند اجازه میدهد تا کاربردهای زبانی جدیدی ایجاد کنند؛ برای مثال سرویس‌های پیام‌رسانی که با هر زبانی قادر خواهید بود تا در آنها به سایر افراد پیام بدهید یا سرویس‌های واقعیت مجازی که با هر زبانی توانایی استفاده از آنها را خواهید داشت.
حدود 7000 زبان در دنیا وجود دارد، اما مدل‌های شناسایی گفتار کنونی فقط قابلیت درک حدود 100 زبان از این بین را دارند. یکی از دلایل پایین بودن این عدد، نیاز این مدل‌ها به مقدار زیاد اطلاعات در زبان مقصد برای یادگیری آن زبان است، چیزی که فقط در زبان‌های کمی دیده می‌شود؛ زبان‌هایی مانند انگلیسی، اسپانیایی و چینی.
پژوهشگران متا این مشکل را با بازطراحی یک مدل هوش مصنوعی قدیمی‌تر که توسط متا در سال 2020 طراحی شده بود حل کردند. این مدل قادر است تا الگوهای گفتار را از طریق صوت و بدون نیاز به اطلاعات نشاندار بسیار زیاد تشخیص دهد و فرا بگیرد.
پژوهشگران این هوش مصنوعی را با دو مجموعه اطلاعاتی تمرین دادند: نخست، مجموعه ضبط شده‌ی انجیل عهد جدید و متون متناظر با آن که در 1107 زبان از بستر اینترنت فراهم آمد، و دوم، مجموعه ضبط شده‌ی انجیل عهد جدید بدون متن متناظر در 3809 زبان.
مایکل آئولی، یکی از پژوهشگرانی که عضوی از این پروژه بوده در این مورد گفت: “ما میتوانیم از چیزهایی که این مدل آموخته برای ساخت سیستم‌های زبانی با اطلاعات قبلی خیلی کم استفاده کنیم. زبان‌هایی مثل انگلیسی، مجموعه اطلاعات ارزشمند بسیار زیادی دارند که میتوانیم از آنها برای ایجاد مدل زبانی استفاده کنیم، اما چنین چیزی برای زبانی که فقط 1000 نفر از آن استفاده میکنند در دسترس نیست!”
این پژوهشگران میگویند که مدل‌های آنها می‌تواند 4000 زبان را شناسایی کند و 1000 زبان را در مکالمه به کار ببرد. آنها همچنین ادعا می‌کنند که مدل‌های خود را با سایر مدل‌های رقیب در بازار مانند Whisper که محصول کمپانی OpenAI است مقایسه کرده‌اند و نتایج نشان میدهد که مدل‌های متا علاوه بر اینکه 11 برابر زبان‌های بیشتری را پوشش میدهند، میزان خطایی نصف بقیه دارند.
البته نگرانی‌هایی نیز در مورد این مدل‌های زبانی وجود دارند؛ کریس امزوئه، یکی از پژوهشگران حوزه‌ی زبان طبیعی در هوش مصنوعی برای زبان‌های آفریقایی، بیان کرده است که استفاده از انجیل به عنوان یک متن مذهبی برای ایجاد یک مدل زبانی، ممکن است باعث ایجاد خطا در ان شود. اکنون باید منتظر ماند و دید آیا این استراتژی جدید از سمت متا، مورد قبول جامعه جهانی قرار خواهد گرفت یا خیر.
به نظر شما آیا مدل‌های زبانی هوش مصنوعی متا، در نهایت افراد را از یادگیری زبان خارجی بی‌نیاز خواهد کرد؟ نظرات خود را با ما در میان بگذارید.

واحد رسانه بارسلون
ارسال دیدگاه