محتوای تاپیک هر 5 ثانیه به طور خودکار بهروز میشود.
به دلیل عدم فعالیت شما در دقایق گذشته، بهروزرسانی خودکار این تاپیک متوقف شده است. Un-Idle
-
بازنگری
-
January 31st, 2025 18:15
#1
شوک DeepSeek: چین چطور کد موفقیت هوش مصنوعی آمریکا را شکست؟
به گزارش ترفندستان به نقل از کانال تلگرامی ITsec NEWS
.
انقلاب جدید در هوش مصنوعی چین
.
شرکتهای چینی در حال توسعه مدلهای زبانی بزرگ (LLM) هستند و با وجود تحریمها و محدودیتهای دسترسی به چیپهای پیشرفته انویدیا، رقابت تنگاتنگی با غولهای غربی دارند. انتشار مدل DeepSeek R1 به نقطه عطفی در این رقابت تبدیل شده و نشان داده که چین میتواند با هزینهای بسیار کمتر، راهکارهای قدرتمند هوش مصنوعی ارائه دهد.
توسعهدهندگان DeepSeek اعلام کردهاند که هزینه آموزش مدل R1 تنها 5.6 میلیون دلار بوده، در حالی که شرکتهایی مانند OpenAI، گوگل و Anthropic میلیاردها دلار برای توسعه مدلهای خود خرج میکنند. با اینکه برخی کارشناسان این رقم را زیر سؤال بردهاند و معتقدند هزینه واقعی بسیار بیشتر بوده، اما این مدل تأثیر قابلتوجهی روی بازار گذاشته؛ به طوری که ارزش سهام غولهای غربی حوزه هوش مصنوعی به شدت افت کرده است.
اما DeepSeek تنها بازیگر این میدان نیست. موفقیت R1 باعث شده سایر شرکتهای چینی نیز مدلهای خود را بهروز کنند و مدعی برتری نسبت به رقبا شوند.
Alibaba: مدلهای جدید با قدرت پردازش بصری
.
علیبابا مدل Qwen2.5-VL و Qwen2.5-Max را معرفی کرده و ادعا دارد که این مدلها در تستهای Arena-Hard، LiveBench، LiveCodeBench و GPQA-Diamond بهتر از DeepSeek V3 عمل کردهاند.
نقطه قوت Qwen2.5-VL در پردازش تصویر، درک مالکیت معنوی و تحلیل دیاگرامهای پیچیده است. همچنین، این مدل از قابلیتهای جدیدی برای تعامل مستقیم با رایانهها و گوشیهای هوشمند برخوردار است.
ByteDance: یادگیری مقرونبهصرفه با مدل Doubao-1.5-pro
.
ByteDance، مالک TikTok، مدل Doubao-1.5-pro را معرفی کرده که در حوزه ریاضیات و برنامهنویسی عملکرد چشمگیری دارد. این مدل توانسته OpenAI o1 را در تست AIME، که به ارزیابی توانایی مدلها در حل مسائل چندمرحلهای ریاضی میپردازد، شکست دهد.
نکته کلیدی Doubao-1.5-pro استفاده از معماری Mixture of Experts (MoE) است که با فعالسازی تنها بخشی از پارامترها در هر پردازش، هزینههای اجرایی را کاهش میدهد. ByteDance ادعا دارد که مدل آنها 5 برابر ارزانتر از DeepSeek و 200 برابر ارزانتر از OpenAI o1 است.
Tencent: بزرگترین مدل باز و انقلاب در تولید محتوای سهبعدی
.
Tencent در نوامبر سه مدل جدید Hunyuan را معرفی کرد که در این میان، Hunyuan-MoE-A52B با 389 میلیارد پارامتر بهعنوان بزرگترین مدل MoE باز دنیا شناخته میشود. این شرکت مدعی است که مدل آنها در درک زبان طبیعی، استدلال منطقی و پاسخگویی بر اساس دانش از DeepSeek و Meta LLama 3.1-405B برتر است.
علاوه بر این، Tencent اخیراً Hunyuan3D 2.0 را رونمایی کرده که قابلیت تبدیل تصاویر دوبعدی به اشیای سهبعدی را دارد. این مدل از لحاظ دقت هندسی، کیفیت بافت و مطابقت با نمونه اصلی نسبت به نسل قبلی بهبود یافته است.
Baidu: پایگاه کاربری 300 میلیونی و آیندهای مبهم
.
Baidu یکی از اولین شرکتهای چینی در حوزه LLM محسوب میشود. مدل Ernie 4.0 این شرکت در سال 2024 توسط دانشگاه تسنگهوا بهعنوان برترین مدل چینی معرفی شد، اما همچنان در حوزه برنامهنویسی و استدلال منطقی از OpenAI و Anthropic عقبتر است.
در ژوئن، Baidu مدل Ernie 4.0 Turbo را با پاسخدهی سریعتر و تحلیل پیشرفتهتر عرضه کرد. با این حال، این شرکت در سال 2024 هنوز مدل جدیدی معرفی نکرده است. اما با 300 میلیون کاربر فعال، همچنان یکی از محبوبترین پلتفرمهای هوش مصنوعی چین به شمار میرود.
آیا غرب دیگر پیشتاز نیست؟
تا چند سال پیش، تصور میشد که چین به دلیل تحریمها و عدم دسترسی به پردازندههای پیشرفته انویدیا، قادر به رقابت با غرب در حوزه هوش مصنوعی نیست. اما مدلهای جدید چینی، بهویژه با استفاده از معماری MoE، نشان دادهاند که هزینههای آموزش و اجرا را میتوان کاهش داد، بدون آنکه کیفیت مدلها افت کند.
با این روند، رقابت در حوزه هوش مصنوعی وارد فاز جدیدی شده و ممکن است در آیندهای نزدیک، چین نهتنها یک رقیب جدی، بلکه یک پیشتاز واقعی در این حوزه باشد.