رویداد I، O 2025

بهبود استدلال، خصوصیت های صوتی و پشتیبانی چندزبانه در هوش مصنوعی گوگل

بهبود استدلال، خصوصیت های صوتی و پشتیبانی چندزبانه در هوش مصنوعی گوگل بازار مقاله: مدل «جمینای ۲.۵ پرو» تنظیمات جدیدی را برای بهبود استدلال، خاصیت های صوتی و پشتیبانی چندزبانه دریافت کرد.


به گزارش بازار مقاله به نقل از ایسنا، گوگل در کنفرانس «Google I/O 2025» از بروزرسانی های جدیدی برای مجموعه مدلهای «جمینای ۲.۵»(Gemini 2.5) خود رونمایی نمود که شامل استدلال قوی تر، خروجی صدای بومی، ارتقاء امنیت و قابلیت های بهبودیافته برای توسعه دهندگان است. گوگل در اعلام بروزرسانی های جدید اظهار داشت: ما در ماه مارس «جمینای ۲.۵ پرو»(Gemini 2.5 Pro) را معرفی کردیم که هوشمندترین مدل ما تا به امروز است و امروز، قابلیت های جدیدی را به ۲.۵ پرو و «۲.۵ فلش»(2.5 Flash) اضافه می نماییم.
به نقل از تایمز آو ایندیا، مدل ارتقاءیافته جمینای ۲.۵ پرو حالا در صدر نمودارهای عملکرد همچون «WebDev Arena» برای کدنویسی و «LMArena» برای آزمایش ترجیحات انسانی قرار دارد. همچنین، این مدل دارای یک پنجره زمینه با یک میلیون توکن است که به آن امکان می دهد تا ورودی های طولانی تر و وظایف درک ویدئو را مدیریت کند.
گوگل اعلام نمود: به لطف «LearnLM» - نسخه ای از جمینای که با متخصصان آموزشی توسعه داده شده - این مدل حالا در وظایف در رابطه با یادگیری هم پیشرو است. مربیان و متخصصان، جمینای ۲.۵ پرو را در طیف متنوعی از سناریوها نسبت به سایر مدلها ترجیح دادند.


صدای بومی، گفتگوی احساسی و پشتیبانی چندزبانه


گوگل خروجی صدای بومی را هم برای داشتن یک تجربه طبیعی تر با هوش مصنوعی معرفی نمود. جمینای حالا می تواند با تُن ها، لهجه ها و سبک های متعدد صحبت کند. برای نمونه، هنگام تعریف کردن یک داستان می تواند صدای دراماتیک داشته باشد. موارد دیگر بهبود صوتی به شرح زیر هستند:
۱. احساسات کاربر را تشخیص می دهد و بر مبنای آنها پاسخ می دهد (گفتگوی عاطفی).
۲. نویز پس زمینه را نادیده می گیرد (صدای فعال).
۳. وظایف صوتی پیچیده تر را انجام می دهد (تفکر در API زنده).
سیستم تبدیل متن به گفتار حالا از چندین گوینده و بیشتر از ۲۴ زبان پشتیبانی می کند و می تواند هنگام گفتگو بین زبان ها جابه جا شود. این خصوصیت ها از راه رابط برنامه نویسی جمینای در دسترس خواهند بود.


تفکر عمیق برای کارهای پیچیده


گوگل اعلام نمود که درحال آزمایش یک حالت استدلال پیشرفته به نام «تفکر عمیق» است که به جمینای کمک می نماید تا قبل از پاسخ دادن، چندین پاسخ را درنظر بگیرد. این حالت برای چالش های دشواری مانند ریاضیات پیشرفته و برنامه نویسی طراحی شده است.
سخنگوی این شرکت اظهار داشت: ما درحال آغاز کردن آزمایش یک حالت استدلال بهبودیافته به نام «دیپ ثینک»(Deep Think) هستیم. ما زمان بیشتری را به ارزیابی های ایمنی پیشرفته تر و دریافت نظرات بیشتر از متخصصان ایمنی اختصاص می دهیم.
دیپ ثینک هم اکنون در معیارهایی مانند «2025 USAMO» برای ریاضی، «LiveCodeBench» برای کدنویسی و «MMMU» برای استدلال چندوجهی پیشرو است.


افزایش سرعت و کارآیی جمینای ۲.۵ فلش


این شرکت اعلام نمود جمینای ۲.۵ فلش که نسخه سبک تر مدل است، حالا از ۲۰ تا ۳۰ درصد توکن کمتر استفاده می نماید و در عین حال، استدلال، کدنویسی و وظایف چندوجهی را بهبود می بخشد. این نسخه حالا در اپلیکیشن جمینای و پلت فرم های «ای آی استودیو»(AI Studio) و «ورتکس ای آی»(Vertex AI) در دسترس می باشد.
انتظار می رود نسخه عمومی مدل بروزرسانی شده در اوایل ژوئن ارائه شود و نسخه ۲.۵ پرو هم اندکی بعد از آن از طریق برسد.



1404/02/31
13:28:53
5.0 / 5
39
تگهای خبر: آموزش , اپلیكیشن , امنیت , شركت
این مطلب را می پسندید؟
(1)
(0)
تازه ترین مطالب مرتبط
نظرات بینندگان بازارمقاله در مورد این مطلب
نظر شما در مورد این مطلب
نام:
ایمیل:
نظر:
سوال:
= ۵ بعلاوه ۱
بازار مقاله MarketDoc
پربیننده ترین ها

پربحث ترین ها

جدیدترین ها

marketdoc.ir - حقوق مادی و معنوی سایت بازار مقاله محفوظ است

بازار مقاله

فروش مقالات و کتب علمی
بازار مقاله، مرجعی برای محققان و دانشجویان، با عرضه مقالات و کتب علمی باکیفیت و قیمت مناسب.