
اوپنایآی سه مدل هوش مصنوعی صوتی جدید را برای پلتفرم توسعهدهندگانش معرفی کرد تا ساخت دستیارهای صوتی هوشمند را سادهتر کند. این مدلها میتوانند هنگام مکالمه به صدا گوش دهند، ترجمه کنند و وظایف مختلف را انجام دهند.
مدلهای جدید شامل GPT-Realtime-2 و GPT-Realtime-Translate و GPT-Realtime-Whisper هستند و فعلا در محیط آزمایشی توسعهدهندگان در دسترس قرار گرفتهاند.
GPT-Realtime-2 برای مدیریت درخواستهای پیچیده، استفاده از ابزارها، حفظ زمینهی مکالمه و واکنش به وقفهها در گفتوگوهای طولانی طراحی شده؛ مدل GPT-Realtime-Translate ترجمهی زنده از بیش از ۷۰ زبان به ۱۳ زبان خروجی را ارائه میکند و برای کاربردهایی مثل پشتیبانی مشتری و آموزش درنظر گرفته شده است.
مدل GPT-Realtime-Whisper قابلیت تبدیل زندهی گفتار به متن را فراهم میکند تا زیرنویس، یادداشت جلسه یا بهروزرسانیهای کاری همزمان با صحبتکردن تولید شوند. شرکتهایی مثل زیلو، پرایسلاین و دویچه تلکام درحال آزمایش این مدلها هستند.
هزینهی استفاده از GPT-Realtime-2 از ۳۲ دلار بهازای هر میلیون توکن صوتی ورودی شروع میشود. GPT-Realtime-Translate بهازای هر دقیقه ۰٫۰۳۴ دلار و GPT-Realtime-Whisper حدود ۰٫۰۱۷ دلار هزینه دارد.





