گوگل جمینی چیه؟ مقایسه Gemini و ChatGPT
اگه واسه شما سواله که گوگل جمینی چیه پس باید بدونین که همهچیز از نوامبر ۲۰۲۲ شروع شد، وقتی که OpenAI چتبات ChatGPT رو معرفی کرد. این ChatGPT یهو ترکوند و همه رو شیفتهی هوش مصنوعی کرد. اینقدر سروصدا کرد که تو سال ۲۰۲۳، هوش مصنوعی تولیدی (GenAI) شد داغترین موضوع تو دنیای تکنولوژی.
مایکروسافت هم که دید اوضاع اینطوریه، اوایل سال ۲۰۲۳ یه سرمایهگذاری چند میلیون دلاری و چند ساله کرد تا به OpenAI کمک کنه سریعتر هوش مصنوعیشو توسعه بده.
گوگلی جمینی هم بیکار ننشست و تو مارس ۲۰۲۳ با Bard وارد گود شد. بعدشم تو فوریهی ۲۰۲۴، Bard رو به Gemini تغییر نام داد و یه نسخهی بهتر از این چتبات هوش مصنوعی رو معرفی کرد.
خلاصه، ChatGPT و گوگلی جمینی حسابی بازار GenAI رو داغ کردن. GenAI از دادههای مدلهای یادگیری ماشینی استفاده میکنه تا به سوالا جواب بده، عکس، متن و ویدیو بسازه. OpenAI و گوگل هم دارن بیوقفه مدلهای زبانی بزرگ (LLM) پشت این دو تا رو بهتر میکنن تا بتونن متنایی تولید کنن که بیشتر شبیه حرف زدن آدما باشه.
مقاله های ما: هوش مصنوعی برای آیفون
حالا ChatGPT چیه؟
ChatGPT همون چتبات باحالیه که با هوش مصنوعی کار میکنه و GenAI رو تو سال ۲۰۲۳ حسابی سر زبونا انداخت. طبق گفتهی مدیرعامل OpenAI، سام آلتمن، ChatGPT فقط تو ۵ روز اول انتشارش تو ۳۰ نوامبر ۲۰۲۲، به ۱ میلیون کاربر رسید!
مدل ChatGPT بر اساس یه چیزی به اسم “Generative Pre-trained Transformer” ساخته شده که الگوها رو تو دنبالهی دادهها پیدا میکنه. این مدل زبانی هوش مصنوعی، جواب سوالای کاربر رو تولید میکنه و به عنوان یه رابط کاربری عمل میکنه که کاربر میتونه باهاش با این مدل زبانی ارتباط برقرار کنه. تا می ۲۰۲۴، GPT-4o به عنوان پیشفرض تو نسخهی رایگان ChatGPT در دسترس بود. البته هنوز هم میتونید GPT-3.5 رو انتخاب کنید که پیشفرض قبلی بود. دسترسی کاملتر به GPT-4o و GPT-4 هم تو نسخههای پولی ChatGPT Plus، ChatGPT Team و ChatGPT Enterprise وجود داره. GPT-4 تو زمان خودش پیشرفتهترین مدل GenAI حساب میشد، ولی گوگل Gemini Advanced رقیب سرسختی براش درست کرد.
کاربردهای محبوب ChatGPT شامل ایناست: تولید محتوا برای ایمیل، پستهای شبکههای اجتماعی و وبلاگها؛ خلاصهسازی متن؛ ترجمهی زبان؛ تولید کد؛ یادگیری و آموزش؛ ساخت دستیارهای مجازی؛ شبیهسازی و آموزش؛ کمک به تحقیق؛ و ساخت بازی و برنامههای سرگرمی دیگه.
ChatGPT چندوجهی (multimodal) هست، یعنی کاربر میتونه از عکس و صدا هم برای تعامل با چتبات استفاده کنه. ChatGPT Voice – که روی گوشیهای iOS و Android در دسترسه – به کاربر این امکان رو میده که با ChatGPT مکالمه کنه و ChatGPT هم میتونه با ۵ صدای مختلف که توسط هوش مصنوعی تولید شده، جواب بده.
ChatGPT و ChatGPT Plus بیشتر برای کاربران شخصی طراحی شدن. نسخهی رایگان ChatGPT از طریق مرورگرهای وب و دستگاههای موبایل در درسترسه. توسعهدهندهها هم میتونن APIهای ChatGPT رو تو برنامههای نرمافزاری خودشون قرار بدن تا کاربرانشون بهش دسترسی داشته باشن.
اشتراک ChatGPT Plus ماهی ۲۰ دلار برای هر کاربر هزینه داره. نسخهی کامل GPT-4o که تو ChatGPT Plus استفاده میشه، سریعتر از نسخههای قبلی GPT جواب میده، دقیقتره و قابلیتهایی مثل تحلیل دادههای پیشرفته رو هم داره. GPT-4o میتونه جوابهای با جزئیات بیشتری تولید کنه و تو کارهایی مثل توضیح عکسها و نوشتن کپشن برای تصاویر، سریعتر عمل میکنه. و در حالی که GPT-3.5 فقط روی دادههای تا ژانویهی ۲۰۲۲ آموزش دیده بود، GPT-4o تا اکتبر ۲۰۲۳ آموزش دیده.
یکی دیگه از مزایای اشتراک ChatGPT Plus اینه که دسترسی به ChatGPT رو حتی تو زمانهای اوج استفاده تضمین میکنه. سرعت پاسخدهی ChatGPT رایگان به پهنای باند و در دسترس بودن بستگی داره. ChatGPT Plus همچنین دسترسی یکپارچه به مدل Dall-E 3 (تبدیل متن به تصویر) OpenAI رو هم فراهم میکنه.
OpenAI، ChatGPT Team و ChatGPT Enterprise رو به شرکتها میفروشه. ChatGPT Team با قیمت ۲۵ دلار در ماه برای هر کاربر (پرداخت سالانه) در دسترس هست. این نسخه همهی قابلیتهای ChatGPT Plus رو داره، اما تعداد پیامهای بیشتری رو تو یه بازهی زمانی مشخص اجازه میده. همچنین میتونه GPTها رو با همکاران به اشتراک بذاره، سرعت پاسخدهیش از ChatGPT Plus بیشتره و یه کنسول مدیریت هم داره. ChatGPT Enterprise دسترسی نامحدود و پرسرعت به GPT-4 داره، قابلیتهای مدیریتی، پشتیبانی مشتری و تحلیلهای پیشرفتهتری داره، پنجرههای محتوای گستردهتری برای ورودیهای طولانیتر داره و سریعترین زمان پاسخگویی رو تو بین تمام نسخههای ChatGPT داره. قیمت ChatGPT Enterprise بسته به میزان استفاده متفاوته.
گوگل جمینی چیه؟
Gemini مدل GenAI گوگل هست که توسط آزمایشگاه تحقیقاتی Google DeepMind ساخته شده. مدل هوش مصنوعی Gemini، ابزار GenAI گوگل به اسم Bard رو که تو مارس ۲۰۲۳ منتشر شد، پشتیبانی میکرد. گوگل در فوریه ۲۰۲۴، Bard رو به Gemini تغییر نام داد و این کار چند ماه بعد از راهاندازی Gemini Advanced که بر اساس LLM جدید Ultra 1.0 انجام شد. در می ۲۰۲۴، گوگل برای اولین بار به کاربران Gemini Advanced دسترسی به مدل جدیدتر Gemini 1.5 Pro رو ارائه داد.
Gemini طوری طراحی شده که اطلاعات رو به صورت یه جواب ساده برگردونه، مثل دستیارهای هوشمندی مثل الکسا و سیری. این مدل از LLMها برای پاسخ دادن به درخواستها با اطلاعاتی که قبلاً یاد گرفته یا از سایر سرویسهای گوگل دریافت میکنه، استفاده میکنه.
گوگل جمینی هم چندوجهی هست – یعنی علاوه بر متن، صدا، ویدیو و کد کامپیوتر رو هم درک میکنه. با این حال، گوگل قابلیت تولید تصویر Gemini رو به دلیل عدم دقت متوقف کرده. گوگل در بیانیهای که برای اعلام این توقف منتشر کرد، قول داد که به زودی قابلیت تولید تصویر بهبود یافته رو دوباره راهاندازی کنه.
قابلیتهای Gemini در موتور جستجوی گوگل ادغام شده و تو برنامههای Google Workspace مثل Docs، Gmail، Sheets، Slides و Meet در دسترس هست. Gemini برای Google Workspace اسم جدید Duet AI برای Google Workspace هست که در واقع جواب گوگل به دستیار هوش مصنوعی Microsoft Copilot بود. Google Gemini از طریق یه برنامه روی گوشیهای اندروید و در برنامه Google روی iOS در دسترس هست.Gemini Advanced بخشی از سرویس اشتراک Google One AI Premium هست که در ایالات متحده ماهی ۱۹.۹۹ دلار هزینه داره. Google One AI Premium همچنین ۲ ترابایت فضای ذخیرهسازی هم داره.
Gemini Advanced یه نسخهی هوش مصنوعی قدرتمندتر از Gemini Pro هست که همچنان به صورت رایگان در دسترس هست. Gemini Advanced با Gemini Pro 1.5 یه پنجرهی متنی بزرگ ۱ میلیون توکنی ارائه میده که امکان تحلیل مجموعههای دادهی بزرگتر رو فراهم میکنه.
گوگل پیشنهاد میده که Gemini Pro و قابلیتهای هوش مصنوعیش، انتخاب بهتری برای توسعه، تحقیق و کارهای خلاقانه هست، مخصوصاً اگه دنبال یه چتبات رایگان هستید. این مدل، هوش مصنوعی رو به کارهای سادهی شخصی میاره. برای کسانی که مایل به پرداخت هزینهی اشتراک هستن، گوگل Gemini Advanced رو برای کاربردهای حرفهای، گردش کارهای سختتر، عملکرد بهتر و قابلیتهای پیشرفتهتر توصیه میکنه. گوگل Advanced همچنین دسترسی زودهنگام به ویژگیهای جدید رو هم شامل میشه.
Gemini Nano، یه بخش دیگه از خانوادهی Google Gemini هست که تو دستگاههایی مثل گوشیهای هوشمند Pixel 8 Pro گوگل استفاده میشه.
نوشته های دیگه از ما: 3 هوش مصنوعی برای ترید
مقایسه ChatGPT و Gemini:
این بخش به مقایسه ChatGPT و Gemini میپردازه و تفاوتهاشون رو توضیح میده.
لیست تفاوتهای بین ChatGPT و Gemini:
یه نگاه اجمالی به تفاوتهای بین ChatGPT و Gemini:
ChatGPT و Google Gemini دارن روز به روز به هم نزدیکتر میشن. هر دو سرویس رایگان، سرویس اشتراکی با قیمت تقریباً یکسان، رابطهای کاربری مشابه و موارد استفادهی یکسانی دارن. تفاوتهاشون بیشتر زیر پوسته هستن – یعنی تو مدلهای زبانیشون.
همچنین برای عملکردهای مشابهی استفاده میشن و کاربر با تایپ یه سوال، جواب میگیره. هر دو نگرانیهایی رو در مورد حریم خصوصی ایجاد میکنن، چون معلوم نیست دادههای کاربر چطوری استفاده میشن. با این حال، تو مدلهای آموزشی، منابع داده، تجربهی کاربری و نحوهی ذخیرهی دادهها با هم فرق دارن.
مدلهای آموزشی:
ChatGPT بر اساس GPT-3.5 یا GPT-4 OpenAI ساخته شده. Gemini سه اندازه داره: Gemini Pro برای طیف وسیعی از کارها، Gemini Ultra برای کارهای بسیار پیچیده و Gemini Nano برای دستگاههای موبایل. Gemini Pro 1.5 که نسخهی اشتراکی Gemini Advanced رو پشتیبانی میکنه، سریعتر و پیشرفتهتر از مدلی هست که برای سرویس رایگان Gemini استفاده میشه.
منابع داده:
تفاوت اصلی بین ChatGPT و Gemini، منابع دادهای هست که برای آموزش LLMهاشون استفاده میشه. GPT-4o از دادههای از پیش تعریف شدهای استفاده میکنه که تا اکتبر ۲۰۲۳ هستن. Gemini از دادههایی استفاده میکنه که از اینترنت و به صورت لحظهای جمعآوری میشن. این مدل طوری تنظیم شده که دادههای انتخاب شده از منابعی که با موضوعات خاصی مثل کدنویسی یا آخرین تحقیقات علمی مطابقت دارن رو انتخاب کنه.
تجربهی کاربری:
کاربران ChatGPT میتونن با هر حساب ایمیلی وارد ChatGPT رایگان بشن. ChatGPT همچنین یه API داره که توسعهدهندهها میتونن ازش برای ادغام LLMهای OpenAI تو نرمافزارهای شخص ثالث استفاده کنن. دکمهی “ذخیره” نداره، اما کاربران میتونن جوابها رو از ChatGPT کپی و تو یه برنامهی دیگه پیست کنن. یه دکمهی “بایگانی” هم داره که میتونه جوابهای قبلی رو تو پنل سمت چپ ChatGPT لیست کنه تا سریع بتونید بهشون دسترسی داشته باشید.
از اونجایی که ChatGPT مبتنی بر متنه، نمیتونه عکس، ویدیو، نمودار یا لینک رو تو جوابهاش قرار بده. همچنین قابلیت جستجو تو اینترنت رو نداره.
به دلیل همکاری نزدیک OpenAI با مایکروسافت، ChatGPT میتونه از طریق برنامههای ویندوز مثل Word، Excel، PowerPoint و Outlook استفاده بشه. همچنین، دستیارهای هوش مصنوعی Copilot مایکروسافت از مدل زبانی GPT-4 استفاده میکنن.
رابط کاربری Gemini Pro به کاربران این امکان رو میده که یه جواب رو لایک یا دیسلایک کنن، اندازهی یا لحن جواب رو تغییر بدن، جواب رو به اشتراک بذارن یا صحتسنجی کنن، یا اون رو به Google Docs یا Gmail صادر کنن. Gemini همچنین یه گزینهی “بررسی پیشنویسهای دیگر” داره که نسخههای جایگزین جوابش رو نشون میده. Gemini همچنین به کاربران اجازه میده که عکس آپلود کنن، اما قابلیت تولید تصویرش به دلیل نقصهایی که داره، متوقفه.
ذخیرهسازی دادهها و حریم خصوصی: هم ChatGPT و هم Google Gemini دادههای کاربر رو ذخیره میکنن.
ChatGPT تمام درخواستها و سوالات وارد شده رو ذخیره میکنه. کاربران میتونن مکالمات قبلی رو از طریق قابلیت بایگانی بررسی کنن. اگرچه کاربران میتونن جوابها و مکالمات رو حذف کنن، اما چتبات ممکنه همچنان از این جوابها تو LLM خودش برای آموزش استفاده کنه. این موضوع نگرانیهایی رو در مورد حریم خصوصی ایجاد میکنه، مخصوصاً وقتی کاربران اطلاعات شخصی یا اطلاعات اختصاصی رو وارد میکنن. OpenAI همچنین فاش میکنه که ChatGPT دادههای موقعیت مکانی، فعالیت شبکه، اطلاعات تماس مثل آدرسهای ایمیل و شماره تلفن، و اطلاعات دستگاه رو جمعآوری میکنه.
طبق سیاست حفظ حریم خصوصی OpenAI، این شرکت هرگونه اطلاعات شخصی که کاربر ارائه میده رو جمعآوری میکنه. این اطلاعات شامل اطلاعات حساب کاربری مثل نام، اطلاعات تماس، اطلاعات کارت پرداخت و تاریخچهی تراکنشها میشه. OpenAI همچنین ممکنه دادههای موقعیت مکانی رو به اشخاص ثالث مثل فروشندگان و ارائهدهندگان خدمات، و به سازمانهای مجری قانون در صورت نیاز قانونی، فاش کنه.
OpenAI اعلام کرده که کاربر حقوق مالکیت دادههای ورودی رو حفظ میکنه و مالک خروجی هست، اما “ممکنه از محتوا برای ارائه، نگهداری، توسعه و بهبود خدماتمون، رعایت قوانین مربوطه، اجرای شرایط و سیاستهای ما و ایمن نگه داشتن خدماتمون استفاده کنه.”
Gemini مکالمات رو تو حساب Google کاربر به مدت ۱۸ ماه ذخیره میکنه، اما کاربران میتونن مدت زمان نگهداری رو تو تنظیمات فعالیتشون به سه یا ۳۶ ماه تغییر بدن. مکالمات Gemini هم میتونن تو جستجوها ظاهر بشن که این هم نگرانیهایی رو در مورد حریم خصوصی ایجاد میکنه.
گوگل فاش میکنه که مکالمات، موقعیت مکانی، بازخورد و اطلاعات استفاده رو جمعآوری میکنه. سیاست حفظ حریم خصوصی گوگل ادعا میکنه که گوگل از دادههای جمعآوری شده برای توسعه، ارائه، نگهداری و بهبود خدمات و ارائه خدمات شخصی مثل محتوا و تبلیغات استفاده میکنه. مشتریان میتونن اطلاعات رو از حسابشون با استفاده از My Google Activity یا با حذف محصولات Google یا حسابهای Googleشون حذف کنن.
گوگل اعلام کرده که اطلاعات رو با رضایت کاربر و در صورت نیاز قانونی، با اشخاص ثالث و مجریان قانون به اشتراک میگذاره.
کدوم چتبات بهتره؟
تو این لحظه یه جورایی یه مسابقهی تسلیحاتی بین GenAI وجود داره، و OpenAI و گوگل دارن مدلهاشون رو بهروز میکنن. گوگل بهویژه تهاجمی عمل کرده، شاید به این دلیل که ChatGPT اول اومد و Gemini باید تلاش کنه تا بهش برسه. با هر نسخهی جدید از LLMها، گوگل و OpenAI پیشرفتهای قابل توجهی نسبت به نسخههای قبلیشون دارن.
به طور کلی، ChatGPT بهترین گزینه برای کارهای مبتنی بر متن محسوب میشه، در حالی که Gemini بهترین انتخاب برای محتوای چندرسانهای هست. با این حال، ملاحظات دیگهای هم وجود داره، همونطور که تو بخشهای قبلی این مقاله اشاره شد. کاربران میتونن نسخههای رایگان رو امتحان کنن تا ببینن کدوم یکی براشون بهتر کار میکنه.
چندین بررسی عمیق در مورد چتباتها وجود داشته که ارزش اشاره کردن رو دارن:
محققا دیدن گوگل جمینی تو بعضی کارا خوبه، ولی به پای GPT-3 و GPT-4 نمیرسه.
یه استاد دانشگاه هم گفته Gemini Advanced میتونه با GPT-4 رقابت کنه، ولی هر دو یه جاهایی اشتباه میکنن.
یه نفر دیگه هم گفته ChatGPT برای چت کردن بهتره، ولی Gemini داره بهش نزدیک میشه.
خلاصه این که نه ChatGPT و نه Gemini کامل نیستن و ممکنه اشتباه کنن. پس حواستون باشه!
مقایسهی جوابهای ChatGPT و Gemini:
ما از ChatGPT 3.5 و گوگل جمین پرو درخواستها و سوالات یکسانی رو پرسیدیم تا ببینیم جوابهاشون چطوری با هم مقایسه میشن. نتایج به این صورته:
ایدهپردازی:
سوال: پنج تا از داغترین ترندهای IT که یه متخصص IT باید بدونه چیه؟
افکار: جوابهای ChatGPT کلیتر بودن، در حالی که Gemini به حوزههای خاصی میپرداخت – به عنوان مثال، هوش مصنوعی تولیدی در مقابل هوش مصنوعی/یادگیری ماشینی و شبکهی امنیت سایبری در مقابل امنیت سایبری. ناتوانی ChatGPT تو ارجاع به دادههای بعد از ژانویهی ۲۰۲۲، اثربخشی اون رو تو جستجوی اطلاعات ترند محدود میکنه. Gemini هم چند تا نکتهی اضافه رو زیر عنوان “ترندهای اضافی” قرار داد.
ایجاد محتوا:
سوال: یه خلاصهی دو پاراگرافی بنویسید که چالشهای انعطافپذیری سایبری رو توضیح بده.
افکار: هر دو تو توضیح و خلاصهسازی یه موضوع پیچیده تو دو پاراگراف خوب عمل کردن، اما Gemini جزئیات بیشتری در مورد چالشها و کارهایی که میشه انجام داد، ارائه داد.
برنامهریزی:
سوال: بهترین کنفرانسهای محاسبات ابری برای شرکت کردن کدومها هستن؟
افکار: ChatGPT کنفرانسهای بیشتری رو لیست کرد، اما لیستش یه کم قدیمی بود، چون اسم چندین کنفرانسش تغییر کرده بود. Gemini جزئیات بیشتری ارائه داد و لیستش رو به حوزههای تخصصی خاصی تقسیم کرد.
کمک به توسعهدهنده:
سوال: ۱۰ تا از کوئریهای SQL که برای پرسوجو از یه پایگاه دادهی PostgreSQL زیاد استفاده میشن رو لیست کنید.
افکار: لیستها شبیه به هم بودن، اگرچه تو بعضی موارد از اصطلاحات متفاوتی استفاده شده بود. یه ویژگی خوب، کد تعبیه شده تو جوابها بود. ما جواب Gemini رو کوتاه کردیم تا تو یه صفحه جا بشه، اما نسخهی طولانیترش شامل کد تعبیه شده بود.
جمع بندی
خلاصه بگم، ChatGPT و جمینی دو تا از خفنترین ابزارای هوش مصنوعیان که کلی کار میکنن، از نوشتن متن تا ساختن عکس. ChatGPT تو نوشتن بهتره و Gemini تو کارای چندرسانهای. کدوم بهتره؟ بستگی داره چی بخوای!
یادت نره از آموزش هوش مصنوعی شروع کنی!