متا دیروز مدل هوش مصنوعی چندزبانه SeamlessM4T را معرفی کرد. این مدل قادر است متن و صدا را پردازش کند و کارهایی مثل ترجمه متن به گفتار، گفتار به نوشتار، گفتار به گفتار و متن به متن را برای ۱۰۰ زبان مختلف انجام دهد. هدف متا از معرفی این مدل، کمک به ارتباط موثرتر کسانی است که به زبان‌های مختلف صحبت می‌کنند.

مدل SeamlessM4T قابلیت‌های زیادی دارد و طبق آنچه که متا در وب‌سایت خود نوشته است ایم مدل می‌تواند گفتار را تشخیص دهد و آن را به متن تبدیل کند، همچنین می‌تواند گفتار را به متن ترجمه کند یا گفتار را به گفتار ترجمه کند. این مدل همچنین قابلیت ترجمه متن به متن و ترجمه متن به گفتار را هم دارد که در هر کدام از آن‌ها از ۱۰۰ زبان پشتیبانی می‌کند.

متا توضیح دقیقی درباره اینکه داده‌های آموزشی این مدل را از کجا تهیه کرده است نداده است. اما ظاهرا داده‌های متنی آن از مجموعه داده‌های NLLB و داده‌های گفتاری آن از ۴ میلیون ساعت صدای خام از یک مخزن داده‌ به دست آمده است که ۱ میلیون ساعت آن مربوط به زبان انگلیسی بوده است.

متا گفته است که SeamlessM4T یک مدل هوش مصنوعی یکپارچه به جای چندین مدل ترکیبی است و همین ویژگی باعث شده تا خطاهای آن کمتر باشد و کارایی ترجمه افزایش یابد.

متا اطلاعات بیشتر درباره نحوه عملکرد SeamlessM4T را در وب‌سایت خود منتشر کرده است که می‌توانید به آن مراجعه کنید.

منبع: arstechnica

اتاق خبر مستر جانبی

منبع: https://techfars.com/259095/metas-massively-multilingual-ai-model-translates-up-to-100-languages-speech-or-text/