پای صحبت دلفینها | هوش مصنوعی گوگل به رمزگشایی ارتباط دلفینها کمک میکند

جدیدترین مدل هوش مصنوعی گوگل برای کمک به مطالعه صحبت دلفینها طراحی شده است
هفت صبح، علیاکبر عبدالله زاده| دلفینها همیشه مخلوقات موردبحثی بودهاند. سالهاست که میگویند هوش این موجودات یک سر و گردن از باقی جاندارانی که میشناسیم بیشتر است و این قضیه کاملا در نوع ارتباطات، همکاریهایشان برای شکار و حتی بازی کردن به چشم میخورد.
کلیکها، سوتها و پالسهایی که از دلفینها میشنویم، شاید برای ما فقط صداهای بامزه بهنظر بیاید، اما برای محققان کمی بیشتر از اینهاست. رویای درک و تفسیر این آواهای پیچیده که زیر آب طنینانداز میشود، مدتهاست که محققان را بر آن داشته تا کمی بیشتر روی رفتار و نوع ارتباطات این مخلوقات باهوش تمرکز کنند.
و اما حالا، گوگل با همکاری مهندسان موسسه فناوری جورجیا و با استفاده از تحقیقات میدانی پروژه دلفینهای وحشی، مدلی از هوش مصنوعی پرطرفدار خود ـ جمینی ـ را معرفی کرده که به نظر میرسد ما را چند قدم به تحقق این امر به جلو برده است.دلفین جما (DolphinGemma)،که درست در روز ملی دلفینها معرفی شد، ابزاری جدید و پایهای برای درک ارتباطات و زیست آب بازسانان است. این مدل پایه بهطور خاص برای یادگیری ساختار صداهای دلفینها آموزشدیده و جالب است که حتی میتواند توالیهای صوتی جدیدی شبیه آواهای دلفینها تولید کند.
تقسیم صدای دلفینها به بخشهای کوچک
پروژه دلفینهای وحشی که از سال ۱۹۸۵ در دستور کار است، طولانیترین مطالعه زیرآبی مستمر روی دلفینها را انجام داده تا درک عمیقی از صداهای وابسته به موقعیت بهدست آورد. این صداها در چند دسته: سوتهای امضایی، که درست مثل اسم و شناسهای منحصربهفرد عمل میکند برای تعاملاتی مثل پیوندهای مادر و فرزندی حیاتی است؛ جیغهای پالسدار که بیشتر در مواقع پرخاش یا درگیری به کار میآید و کلیکهای وزوز مانند که اکثرا در مواقع جفتیابی تولید میشود گروهبندی شدهاند.
این تحلیل بلندمدت و برچسبگذاریشده، تمهیدات اولیه برای تولید مدلی مثل «دلفین جما» را فراهم کرده است که بر پایه فناوری مدلهای جِما گوگل طراحی شده و با چهارصد میلیون پارامتر، روی گوشیهای پیکسل هم قابل اجراست. این مدل ابتدا صداهای دلفینها را به بخشهای کوچک تقسیم میکند، سپس با تحلیل آنها، الگوهای تکرارشونده را پیدا کرده و حتی میتواند حدس بزند دلفین مورد نظر بعد از آن چه صدایی تولید خواهد کرد! دقیقاً مانند پیشبینی کلمات در هوش مصنوعیهای متنی مثل جمینی.
ایجاد یک واژگان ارتباطی مشترک با دلفینها
درحالیکه دلفینجما بر درک ارتباطات طبیعی تمرکز دارد، یک پروژه موازی مسیر متفاوتی را نیز بررسی میکند: تعامل فعال دوسویه. به زبان سادهتر، سیستم مکالمه این مدل پایه نیز در حال توسعه یافتن است که هدفش ایجاد یک زبان مشترک ساده بین انسان و دلفینهاست.سیستم مکالمهای که در دست بررسی است و توسط گوگل با همکاری موسسه فناوری جورجیا توسعه یافته، هدفش صرفا ایجاد یک واژگان و شیمی ارتباطی مشترک سادهتر است، نه ترجمه مستقیم زبان و اصوات پیچیده دلفینها.
این مفهوم، براساس ارتباط دادن و شرطیسازی سوتها و پالسهای ساختهشده توسط ابزار هوش مصنوعی و متفاوت از صداهای طبیعی و مرتبط ساختن آنها با اشیایی است که دلفینها از تعامل با آنها لذت میبرند، مثل توپ یا جلبک. محققان ارتباط بین سوت و شیء را به دلفینشان میدهند و امیدوارند که کنجکاوی ذاتی و طبیعی دلفینها آنها را به تقلید این صداهای ساختهشده، برای درخواست اشیای مورد نظر ترغیب کند.
هرچه صداهای طبیعی بیشتری از دلفینها از طریق مدلهایی مثل دلفینجما درک شوند، احتمال تعامل این موجودات در بستر مکالمه هوش مصنوعی با انسان، قابل انتظارتر و عملیتر خواهد شد.مدلهای نصبشده روی سِری پیکسل با پردازش صدا در همان لحظه، به محققان کمک میکنند تا در محیط گستردهای مثل اقیانوس، واکنش سریعی به ارتباط دلفینها نشان دهند. نسخه جدید این سیستم که در سال آینده منتشر میشود از پیکسل ۹ استفاده خواهد کرد.
استفاده از گوشیهای هوشمند در این روند، نیاز به سختافزارهای سفارشی حجیم و گرانقیمت را بهشدت کاهش میدهد. این ابزار قابلیت پردازش و میزان استهلاک را بهبود میبخشد، نیاز به انرژی مضاعف را کم میکند و ابعاد فیزیکی سیستم مورد نیاز را کوچک و قابل حملتر میکند. علاوه بر این، قدرت پیشبینی دلفینجما در سیستم مکالمه مورد انتظار، میتواند به شناسایی سریعتر تقلیدهایی که دلفین مورد نظر کمک کند و تعاملات با این موجود را روانتر و موثرتر سازد.
شرکت گوگل با توجه به شعار همیشگیاش که: پیشرفتهای بزرگ اغلب حاصل همکاریهای بزرگ هستند، قصد دارد دلفینجما را بهعنوان یک مدل متنباز در تابستان امسال منتشر کند. اگرچه این مدل روی دلفینهای خالدار اقیانوس اطلس آموزشدیده و برنامهریزیشده است، فرایند سیستمی آن برای محققانی که سایر آببازسانان را نیز مطالعه میکنند قابل ارائه خواهد بود و تنها ممکن است نیاز به تنظیم دقیق و مستقل برای طیف صوتی گونههای دیگر داشته باشد.