پای صحبت دلفین‌ها | هوش مصنوعی گوگل به رمزگشایی ارتباط دلفین‌ها کمک می‌کند

جدیدترین مدل هوش مصنوعی گوگل برای کمک به مطالعه صحبت دلفین‌ها طراحی شده است

هفت صبح، علی‌اکبر عبدالله زاده| دلفین‌ها همیشه مخلوقات موردبحثی بوده‌اند. سال‌هاست که می‌گویند هوش این موجودات یک سر و گردن از باقی جاندارانی که می‌شناسیم بیشتر است و این قضیه کاملا در نوع ارتباطات، همکاری‌هایشان برای شکار و حتی بازی کردن به چشم می‌خورد.

کلیک‌ها، سوت‌ها و پالس‌هایی که از دلفین‌ها می‌شنویم، شاید برای ما فقط صداهای بامزه به‌نظر بیاید، اما برای محققان کمی بیشتر از این‌هاست. رویای درک و تفسیر این آواهای پیچیده که زیر آب طنین‌انداز می‌شود، مدت‌هاست که محققان را بر آن داشته تا کمی بیشتر روی رفتار و نوع ارتباطات این مخلوقات باهوش تمرکز کنند.

و اما حالا، گوگل با همکاری مهندسان موسسه فناوری جورجیا و با استفاده از تحقیقات میدانی پروژه دلفین‌های وحشی، مدلی از هوش مصنوعی پرطرفدار خود ـ جمینی ـ را معرفی کرده که به نظر می‌رسد ما را چند قدم به تحقق این امر به جلو برده است.دلفین جما (DolphinGemma)،که درست در روز ملی دلفین‌ها معرفی شد، ابزاری جدید و پایه‌ای برای درک ارتباطات و زیست آب بازسانان است. این مدل پایه به‌طور خاص برای یادگیری ساختار صداهای دلفین‌ها آموزش‌دیده و جالب است که حتی می‌تواند توالی‌های صوتی جدیدی شبیه آواهای دلفین‌ها تولید کند.

تقسیم صدای دلفین‌ها به بخش‌های کوچک

پروژه دلفین‌های وحشی که از سال ۱۹۸۵ در دستور کار است، طولانی‌ترین مطالعه زیرآبی مستمر روی دلفین‌ها را انجام داده تا درک عمیقی از صداهای وابسته به موقعیت به‌دست آورد. این صداها در چند دسته: سوت‌های امضایی، که درست مثل اسم و شناسه‌ای منحصربه‌فرد عمل می‌کند برای تعاملاتی مثل پیوندهای مادر و فرزندی حیاتی است؛ جیغ‌های پالس‌دار که بیشتر در مواقع پرخاش یا درگیری به کار می‌آید و کلیک‌های وزوز مانند که اکثرا در مواقع جفت‌یابی تولید می‌شود گروه‌بندی شده‌اند.

این تحلیل بلندمدت و برچسب‌گذاری‌شده، تمهیدات اولیه برای تولید مدلی مثل «دلفین جما» را فراهم کرده است که بر پایه فناوری مدل‌های جِما گوگل طراحی شده و با چهارصد میلیون پارامتر، روی گوشی‌های پیکسل هم قابل اجراست. این مدل ابتدا صداهای دلفین‌ها را به بخش‌های کوچک تقسیم می‌کند، سپس با تحلیل آن‌ها، الگوهای تکرارشونده را پیدا کرده و حتی می‌تواند حدس بزند دلفین مورد نظر بعد از آن چه صدایی تولید خواهد کرد! دقیقاً مانند پیش‌بینی کلمات در هوش مصنوعی‌های متنی مثل جمینی.

ایجاد یک واژگان ارتباطی مشترک با دلفین‌ها

درحالی‌که دلفین‌جما بر درک ارتباطات طبیعی تمرکز دارد، یک پروژه موازی مسیر متفاوتی را نیز بررسی می‌کند: تعامل فعال دوسویه. به زبان ساده‌تر، سیستم مکالمه این مدل پایه نیز در حال توسعه یافتن است که هدفش ایجاد یک زبان مشترک ساده بین انسان و دلفین‌هاست.سیستم مکالمه‌ای که در دست بررسی است و توسط گوگل با همکاری موسسه فناوری جورجیا توسعه یافته، هدفش صرفا ایجاد یک واژگان و شیمی ارتباطی مشترک ساده‌تر است، نه ترجمه مستقیم زبان و اصوات پیچیده دلفین‌ها.

این مفهوم، براساس ارتباط دادن و شرطی‌سازی سوت‌ها و پالس‌های ساخته‌شده توسط ابزار هوش مصنوعی و متفاوت از صداهای طبیعی و مرتبط ساختن آنها با اشیایی است که دلفین‌ها از تعامل با آنها لذت می‌برند، مثل توپ یا جلبک. محققان ارتباط بین سوت و شیء را به دلفین‌شان می‌دهند و امیدوارند که کنجکاوی ذاتی و طبیعی دلفین‌ها آنها را به تقلید این صداهای ساخته‌شده، برای درخواست اشیای مورد نظر ترغیب کند.

هرچه صداهای طبیعی بیشتری از دلفین‌ها از طریق مدل‌هایی مثل دلفین‌جما درک شوند، احتمال تعامل این موجودات در بستر مکالمه هوش مصنوعی با انسان، قابل انتظارتر و عملی‌تر خواهد شد.مدل‌های نصب‌شده روی سِری پیکسل با پردازش صدا در همان لحظه، به محققان کمک می‌کنند تا در محیط گسترده‌ای مثل اقیانوس، واکنش سریعی به ارتباط دلفین‌ها نشان دهند. نسخه جدید این سیستم که در سال آینده منتشر می‌شود از پیکسل ۹ استفاده خواهد کرد.

استفاده از گوشی‌های هوشمند در این روند، نیاز به سخت‌افزارهای سفارشی حجیم و گران‌قیمت را به‌شدت کاهش می‌دهد. این ابزار قابلیت پردازش و میزان استهلاک را بهبود می‌بخشد، نیاز به انرژی مضاعف را کم می‌کند و ابعاد فیزیکی سیستم مورد نیاز را کوچک‌ و قابل حمل‌تر می‌کند. علاوه بر این، قدرت پیش‌بینی دلفین‌جما در سیستم مکالمه مورد انتظار، می‌تواند به شناسایی سریع‌تر تقلیدهایی که دلفین مورد نظر کمک کند و تعاملات با این موجود را روان‌تر و موثرتر سازد.

شرکت گوگل با توجه به شعار همیشگی‌اش که: پیشرفت‌های بزرگ اغلب حاصل همکاری‌های بزرگ هستند، قصد دارد دلفین‌جما را به‌عنوان یک مدل متن‌باز در تابستان امسال منتشر کند. اگرچه این مدل روی دلفین‌های خالدار اقیانوس اطلس آموزش‌دیده و برنامه‌ریزی‌شده است، فرایند سیستمی آن برای محققانی که سایر آب‌بازسانان را نیز مطالعه می‌کنند قابل ارائه خواهد بود و تنها ممکن است نیاز به تنظیم دقیق و مستقل برای طیف صوتی گونه‌های دیگر داشته باشد.

تازه‌ترین تحولاتدانش و فناوریرا اینجا بخوانید.