You are currently viewing ما چت ربات هوش مصنوعی Gemini گوگل را امتحان کردیم و آن را قوی‌تر یافتیم، اما همچنان مستعد توهم بود.

ما چت ربات هوش مصنوعی Gemini گوگل را امتحان کردیم و آن را قوی‌تر یافتیم، اما همچنان مستعد توهم بود.


گوگل با مولد خود راه طولانی را پیموده است هوش مصنوعی (AI) پیشنهادات. یک سال پیش، زمانی که غول فناوری برای اولین بار دستیار هوش مصنوعی خود، Bard را معرفی کرد، به یک شکست تبدیل شد زیرا در پاسخ به سوالی در مورد تلسکوپ فضایی جیمز وب دچار خطای واقعی شد. از آن زمان، غول فناوری پاسخ‌های ربات چت را بهبود بخشیده، مکانیزم بازخوردی را برای تأیید منبع پشت پاسخ‌ها و موارد دیگر اضافه کرده است. اما بزرگترین پیشرفت زمانی رخ داد که شرکت مدل زبان بزرگ (LLM) را تغییر داد و ربات چت را از Gemini’s Pathways Language Model 2 (PaLM 2) در دسامبر 2023 تقویت کرد.

این شرکت هوش مصنوعی Gemini را قدرتمندترین مدل زبانی خود نامید. همچنین قابلیت تولید تصاویر هوش مصنوعی را به چت بات اضافه کرد و آن را چند وجهی کرد و حتی نام آن را جمینی تغییر داد. اما این چه جهشی برای یک چت ربات هوش مصنوعی است؟ آیا اکنون می تواند با آن رقابت کند مایکروسافت Copilot که مبتنی بر GPT-4 است و قابلیت هایی دارد؟ و در مورد موارد توهم هوش مصنوعی (پدیده ای که در آن هوش مصنوعی با اطلاعات نادرست یا ناموجود به عنوان واقعیت واکنش نشان می دهد) چطور؟ ما تصمیم گرفتیم که بفهمیم.

در حال حاضر، هوش مصنوعی گوگل از طرق مختلفی قابل دسترسی است. Google Advanced یک اشتراک پولی با طرح Google One AI Premium است که مبلغی معادل روپیه دارد. ماهانه 1950 یک برنامه اندروید جمینی گوگل نیز وجود دارد. با این حال، هنوز در هند در دسترس نیست. گوگل پیکسل 8 پرو همچنین با مدل Gemini Nano عرضه می شود. برای اهداف آزمایشی خود، تصمیم گرفتیم از پورتال وب Gemini Pro Google استفاده کنیم که در بیش از 230 کشور و منطقه موجود است و استفاده از آن رایگان است.

قابلیت های مولد Google Gemini

رابط کاربری وب سایت به همان صورت باقی مانده است، اما نام آن از Bard به Gemini تغییر یافته است. اگر با حساب Google خود وارد شده باشید، هوش مصنوعی با نام از شما استقبال می کند و از شما می پرسد: «امروز چگونه می توانم به شما کمک کنم؟» در زیر چند پیشنهاد مفید و سریع وجود دارد که وظایف مختلفی را که می تواند انجام دهد برجسته می کند.

ابتدا از او خواستیم که یک ایمیل بنویسد تا مهارت های اولیه تولیدی خود را آزمایش کند. با توجه به اینکه فصل اخراج است، از او خواستیم «ایمیل خوبی از یک مدیر برای یک کارمند بنویسد و به آنها اطلاع دهد که اخراج شده اند». برای آزمایش اثربخشی آن، به Copilot گفتیم که همین کار را انجام دهد. ما پاسخ Gemini را کاملا خسته کننده و روباتیک یافتیم و سعی می کرد در همان ابتدا اطلاعات زیادی را جمع آوری کند. پاراگراف اول این بود: «با کمال تأسف می نویسم تا شما را از تصمیم دشواری که مجبور به گرفتن آن بودیم آگاه کنم. [Company Name]. به خاطر اینکه [reason]ما ملزم به اخراج در نیروی کار خود هستیم و موقعیت شما حذف خواهد شد، موثر [date]”

در مقایسه، پاسخ Copilot دلسوزانه تر و انسانی تر به نظر می رسید. در آن نوشته شده بود: «امیدوارم این ایمیل شما را خوب بیابد. با کمال تاسف به اطلاع شما می‌رسانم که به دلیل تغییرات سازمانی اخیر مجبور به اتخاذ تصمیمات دشواری شده‌ایم. متأسفانه، موقعیت شما در [Company Name] تحت تأثیر قرار گرفته است و من با تأسف عمیق به شما اطلاع می دهم که شما از کار بیکار شده اید.’

این نباید تعجب آور باشد، زیرا چت ربات گوگل به دلیل خسته کننده بودن در تولید محتوای رسمی بدنام است و این موضوع حتی با مدل جمینی نیز تغییر نکرده است. با این حال، وقتی نوبت به تولید محتوای غیررسمی می رسد، جمینی شروع به نشان دادن توانایی های خود می کند.

ما از هر دو ربات چت خواستیم که «نامه ای بنویسند و به مادرم اطلاع دهند که من اخراج شده ام و یادداشت کوتاهی برای مادرم بنویسند و توضیح دهند که من اخراج شده ام. مطمئن شوید که احساسات غم و اندوه من را منتقل می کنید.

Copilot آن را به معنای واقعی کلمه دریافت کرد و نوشت: «همه ناگهانی بودن آن باعث شد من ترکیبی از احساسات را احساس کنم – غم، اندوه و کمی عدم اطمینان در مورد آنچه که قرار است اتفاق بیفتد.» اما گوگل پیام اصلی را دریافت کرد و کار بسیار بهتری در بیان آن انجام داد. احساسات. در آن نوشته شده بود: «می دانم که شما همیشه نگران امنیت شغلی بوده اید و ای کاش می توانستم به شما بگویم که این موضوع متفاوت است. من اشتباه نکردم، آنها بودند [reason]. من سعی می کنم مثبت بمانم، اما سخت است که احساس دلسردی نکنم. من نمی خواهم شما خیلی نگران باشید. من وحشت زده نیستم و در حال حاضر شروع به فکر کردن در مورد مراحل بعدی خود کرده ام.

این خیلی بهتر بود کنار هم گذاشت و می‌توان آن را ببخشید که فکر می‌کرد یک شخص واقعی نوشته است. ما چند آزمایش دیگر انجام دادیم و پاسخ‌های Gemini هر بار بسیار متعادل‌تر از Copilot مجهز به GPT-4 بود.

دقت گوگل جمینی

تست بعدی بررسی دقت مدل هوش مصنوعی بود. بسیاری از هوش مصنوعی برای دریافت پاسخ به یک پرس و جو استفاده می کنند، و ما هم می خواستیم همین کار را انجام دهیم. او در سؤالات استاتیک مبتنی بر دانش عمومی به خوبی عمل کرد. حتی وقتی چند سوال منطقه خاکستری فرستادیم، او به حقایق پایبند بود و اطلاعات اضافی را درج نکرد. هنگامی که سؤالات بحث برانگیز بود، از پاسخ دادن به آنها خودداری کرد، این همان چیزی است که شما از یک چت بات مسئول هوش مصنوعی انتظار دارید.

مشکل زمانی پیش آمد که ما از آن یک سوال ترفند محبوب پرسیدیم که در گذشته نسل قدیمی ربات‌های چت را نگران کرده بود. هنگامی که ما این سوال را پرسیدیم که “کشورهایی در آفریقا که با حرف K شروع می شوند”، او به طور ناخواسته پاسخ داد: “از امروز، 12 فوریه 2024، هیچ کشوری در آفریقا وجود ندارد که با حرف “K” شروع شود. اگرچه ممکن است شرایط تغییر کند. زمان، این واقعیت برای مدتی ثابت بوده است. برای افراد ناآشنا، مشکل به این دلیل به وجود می‌آید که LLM که او در آن آموزش دیده بود عبارت سریع با همان پاسخ را داشت. جالب اینجاست که این مشکل خاص در Copilot و ChatGPT وجود دارد و علیرغم گزارش های منظم، هنوز برای هیچ یک از ربات های چت برطرف نشده است.

با این حال، مشکل توهمات هوش مصنوعی به همین جا ختم نمی شود. همچنین با تعدادی پاسخ اشتباه دیگر از جمینی مواجه شدیم. وقتی از ما پرسیدیم «بر اساس بررسی‌ها، جوانب مثبت و منفی آیفون 15 پرو را به من بگویید»، او پاسخ داد: آیفون 15 پرو هنوز به طور رسمی اعلام نشده است. در واقع گوشی هوشمند اپل در سپتامبر سال گذشته عرضه شد. در مقایسه، Copilot در مسائل فنی بهتر عمل کرد.

Google Gemini در کارهای کمکی

یکی دیگر از مهارت هایی که بیشتر چت ربات های هوش مصنوعی به آن می بالند، ویژگی های کمکی آنهاست. آنها می توانند ایده ای را ایده بگیرند، برنامه سفر ایجاد کنند، گزینه های شما را مقایسه کنند و حتی با شما چت کنند. ما با درخواست از او شروع کردیم تا یک برنامه سفر 5 روزه به گوا را با بودجه مشخص کند و کارهایی را که مردم می توانند انجام دهند را در آن گنجانده باشد. از آنجایی که نویسنده اخیراً در گوا بود، آزمایش برای ما آسان تر بود. در حالی که Gemini در برجسته کردن همه مقاصد محبوب کار مناسبی انجام داد، پاسخ دقیق نبود و تفاوت چندانی با هیچ وب سایت مسافرتی نداشت. یکی از نکات مثبت این موضوع این است که ربات چت احتمالا هیچ چیز نادرستی را پیشنهاد نمی کند.

از سوی دیگر، من تحت تاثیر پاسخ جامع Copilot قرار گرفتم که شامل جواهرات پنهان و حتی نام غذاهایی بود که باید امتحان کنید. ما آزمایش را با تغییرات مختلف تکرار کردیم، اما نتیجه ثابت ماند.

سپس پرسیدیم: «من در هند زندگی می کنم. آیا باید برای Amazon Prime Videos یا Netflix اشتراک بخرم؟» پاسخ جامع بود و شامل پارامترهای مختلفی از جمله عمق محتوا، قیمت، ویژگی‌ها و مزایا بود. اگرچه مستقیماً یکی از آنها را پیشنهاد نمی کند، اما فهرست می کند که چرا کاربر باید یکی از گزینه ها را انتخاب کند. پاسخ کمک خلبان هم همین بود.

در نهایت، زمانی را صرف صحبت با جمینی کردیم. این تست چندین ساعت به طول انجامید و ما توانایی چت بات را برای جذاب، سرگرم کننده، آموزنده و متنی آزمایش کردیم. در تمام این پارامترها، Gemini عملکرد بسیار خوبی داشت. او می تواند به شما یک جوک بگوید، حقایق کمتر شناخته شده را به اشتراک بگذارد، به شما توصیه کند و حتی با شما بازی های کلمه و تصویر انجام دهد. ما همچنین حافظه او را آزمایش کردیم، اما او حتی پس از یک ساعت پیامک، تبدیل را به خاطر می آورد. تنها کاری که نمی تواند انجام دهد این است که مانند یک دوست انسانی به پیام ها یک خط پاسخ دهد.

امکان تولید تصاویر گوگل جمینی

در آزمایش خود، با یک سری چیزهای جالب در مورد قابلیت های تولید تصویر Gemini AI مواجه شدیم. به عنوان مثال، تمام تصاویر تولید شده دارای وضوح 1536×1536 هستند که قابل تغییر نیستند. ربات چت همچنین از انجام هرگونه درخواستی که نیاز به تولید تصاویری از افراد واقعی داشته باشد، خودداری می‌کند، که احتمالاً خطرات جعلی‌های عمیق را به حداقل می‌رساند (ایجاد عکس‌های ایجاد شده توسط هوش مصنوعی از افراد و اشیایی که واقعی به نظر می‌رسند).

اما وقتی صحبت از کیفیت به میان می‌آید، جمینی کار محکمی برای پایبندی به سرعت و تولید تصاویر انجام می‌دهد. این می تواند عکس های تصادفی را در سبک خاصی مانند پست مدرن، واقع گرایانه و شمایل نگاری ایجاد کند. ربات چت همچنین می تواند تصاویری به سبک هنرمندان محبوب تاریخ تولید کند. با این حال، محدودیت‌های زیادی وجود دارد، و احتمالاً متوجه خواهید شد که یک جمینی درخواست شما را رد می‌کند، اگر چیزی خیلی خاص بخواهید. اما با مقایسه آن با Copilot، متوجه شدم که تصاویر سریع‌تر تولید می‌شوند، به دستورات وفادار می‌مانند، و به نظر می‌رسید که طیف وسیع‌تری از سبک‌ها را داشته باشیم که می‌توانیم از آنها استفاده کنیم. با این حال، نمی تواند با مدل های تصویربرداری تخصصی هوش مصنوعی مانند DALL-E و Midjourney مقایسه شود.

گوگل جمینی: خط پایین

به طور کلی، ما متوجه شدیم که هوش مصنوعی Gemini در اکثر دسته ها کاملاً شایسته است. به عنوان فردی که از زمانی که چت ربات هوش مصنوعی در دسترس قرار گرفته به ندرت از آن استفاده کرده است، می توانم با اطمینان بگویم که مدل Gemini Pro درک بهتری از ارتباطات زبان طبیعی و درک متنی درخواست ها ایجاد کرده است. نسخه رایگان چت بات یک همراه قابل اعتماد است اگر برای ایجاد ایده، نوشتن یادداشت غیررسمی، برنامه ریزی برای سفر یا حتی تولید تصاویر اولیه به آن نیاز دارید. با این حال، نباید از آن به عنوان یک ابزار تحقیق یا برای نوشتن رسمی استفاده شود، زیرا این دو حوزه ای هستند که در آن به شدت با مشکل مواجه هستند.

در مقایسه، Copilot در نوشتن رسمی و ایجاد مسیرها، همراه با انجام مکالمات (البته با حافظه کوتاه تر) و مقایسه ها بهتر است. Gemini در تولید تصویر، تولید محتوای غیررسمی و تعامل با کاربران تاج را به دست می‌گیرد. با توجه به اینکه این تنها اولین نسخه از Gemini LLM است، برخلاف نسخه چهارم GPT، ما کنجکاو هستیم که شاهد راه‌های مختلفی باشیم که غول فناوری از طریق آن دستیار هوش مصنوعی خود را بهبود می‌بخشد.


پیوندهای وابسته ممکن است به طور خودکار ایجاد شوند – به ما مراجعه کنید بیانیه اخلاقی برای جزئیات



Source link