Çindən süni intellekt sahəsində sensasion YENİLİK

Çindən süni intellekt sahəsində sensasion YENİLİKÇinin süni intellekt sahəsində fəaliyyət göstərən startapı DeepSeek, sensasion bir açıqlama edərək, aparıcı süni intellekt şirkətlərinin modellərinə bənzər bir modeli 11 dəfə daha az hesablama gücü ilə hazırladıqlarını elan edib.

Lent.az xəbər verir ki, DeepSeek-in təqdim etdiyi məlumatlara görə, OpenAI, Meta və Anthropic kimi nəhənglərin modellərinə bənzər DeepSeek-V3 adlı dil modeli cəmi 2 ay ərzində 2.048 Nvidia H800 GPU-sundan ibarət bir qrup vasitəsilə 671 milyard parametr üzərində öyrədilib. Bu, təxminən 2.8 milyon GPU saatı deməkdir. Müqayisə üçün, Meta-nın 405 milyard parametrə malik Llama 3 modelini 54 gün ərzində 16.384 H100 GPU istifadə edərək öyrətməsi üçün 11 dəfə daha çox hesablama gücü (30.8 milyon GPU saatı) tələb olunub.

DeepSeek, qabaqcıl əlaqə xətti (pipeline) alqoritmləri, optimallaşdırılmış rabitə çərçivəsi və FP8 aşağı dəqiqlikli hesablama üsulundan istifadə edərək bu cür miqyaslı modellər üçün adətən tələb olunan hesablama və yaddaş ehtiyaclarını əhəmiyyətli dərəcədə azaltdığını iddia edir. Şirkət, DeepSeek-V3 modelinin hesablama tələblərini azaltmaq üçün onlarla optimizasiya texnikası tətbiq etdiyini vurğulasa da, bir neçə əsas texnologiya bu nəticələrin əldə olunmasında həlledici rol oynayıb. DeepSeek, DualPipe adlı alqoritmdən istifadə edərək həm hesablama, həm də rabitə mərhələlərində effektivliyi artırdığını bildirir. Bu alqoritm, xüsusilə MoE arxitekturasının tələb etdiyi qovşaqlararası ekspert paralelliyi üçün təlim darboğazlarını minimuma endirib. Beləliklə, sıfıra yaxın rabitə yükü ilə 14.8 trilyon simvolun işlənməsi mümkün olub.

Bundan əlavə, DeepSeek rabitə zamanı istifadə olunan qovşaqların sayını hər simvol üçün maksimum 4 qovşaqla məhdudlaşdırıb. Bu yanaşma trafiki azaldıb və rabitənin hesablama ilə effektiv şəkildə üst-üstə düşməsinə imkan verib. Performans baxımından, şirkət DeepSeek-V3 MoE modelinin bəzi göstəricilər üzrə GPT-4x, Claude-3.5-Sonnet və LLama-3.1 modelləri ilə müqayisə edilə bilən, bəzən isə onları ötüb, keçən nəticələr verdiyini bildirir. Lakin bu iddiaların müstəqil tədqiqatçılar tərəfindən təsdiqlənməsinə ehtiyac var. Şirkət modeli və onun parametrlərini açıq mənbə kimi təqdim edib, buna görə də yaxın vaxtlarda müqayisəli testlərin aparılması gözlənilir.

DeepSeek-V3 modeli parametrlərin sayı və ya məntiqi düşünmə qabiliyyətləri baxımından GPT-4 və ya Llama-3 kimi qabaqcıl modellərdən geri qalsa da, məhdud resurslarla yüksək səviyyəli bir MoE modelinin hazırlanmasının mümkün olduğunu nümayiş etdirir. Təbii ki, bu, çoxlu optimizasiya və aşağı səviyyəli proqramlaşdırma tələb edir, lakin nəticələr olduqca ümidverici görünür. DeepSeek komandası, DeepSeek-V3 modelinin tətbiqinin inkişaf etmiş avadanlıqla yanaşı, prefilling və dekodlaşdırma mərhələlərini bir-birindən ayıran xüsusi paylama strategiyası tələb etdiyini, bunun isə resurs çatışmazlığı səbəbindən kiçik şirkətlər üçün əlçatmaz ola biləcəyini etiraf edir.


Sonxeber.az
Telegramda izləyin
Dünyada   Baxılıb: 940   Tarix: 28 dekabr 2024  

Şikayətiniz varsa Whatsapp: 077 7125666

Facebookda Paylaş


Oxşar xəbərlər

.

Danimarkada yeni hökuməti formalaşdırmaq mümkün olmayıb

Danimarkada Liberal Partiyanın lideri Troels Lund Poulsen yeni hökumətin formalaşdırılması barədə razılığa gələ bilməyib. "Report"un "Ritzau" agentliyinə istinadən xəbərinə görə, siyasətçi danışıqların uğursuzluğu barədə Kral X Frederikə məlumat verəcəyini bildirib. Liberal Partiyanı

24 may
.

Ölkəni şoka salan OLAY: ata-ana uşaqlarının gözlərini bağlayıb meşədə azdırdı

Portuqaliyada 41 yaşlı Marin Russo və onun 55 yaşlı həyat yoldaşı Mark Ballabriqa uşaqlara qarşı qəddar rəftar şübhəsi ilə saxlanılıblar. xarici KİV-ə istinadla bildirir ki, cütlük 5 və 3 yaşlı oğullarını gözləri bağlı vəziyyətdə meşədə tərk edib. Oğlanlar Alkaser-du-Sal və Komporta kurort şəhərlər

24 may
.

Paşinyan Baş nazir vəzifəsindən istefa verməsi üçün şərtini açıqlayıb

Ermənistanın Baş naziri Nikol Paşinyan vətəndaşların əksəriyyətinin tələbi ilə vəzifəsindən istefa verməyə hazır olduğunu bildirib. "Report" xəbər verir ki, Paşinyanın şənbə günü seçki kampaniyası zamanı çıxışında bir kişi ona yaxınlaşaraq Baş nazir vəzifəsindən istefa verməsini qışqırb. "Əgə

24 may
.

Çində heyvanların səsini tərcümə edən qurğu hazırlanıb

Çin "Meng Xiaoyi" startapı heyvanlar üçün səs tərcüməçisi yaratdığını elan edib. Qurğu ev heyvanının boynuna taxılır və səsləri, emosiyaları və dili tanıyır. xəbər verir ki, bu barədə "Oddity Central" məlumat verib. Süni intellektlə işləyən cihaz heyvan dilini təxminən 95% dəqiqlikl

23 may
.

Rusiya Kiyev vilayətini "Oreşnik" ballistik raketi ilə vurub

Rusiya Silahlı Qüvvələri mayın 24-nə keçən gecə Kiyev vilayətinə RS-26 "Rubej" ("Oreşnik") orta mənzilli ballistik raketi ilə zərbə endiriblər. "RBK-Ukrayna" agentliyinə istinadən xəbər verir ki, bunu Ukrayna Hərbi Hava Qüvvələrinin Kommunikasiya İdarəsinin rəisi Yuri İqna

24 may
.

ABŞ ordusunda hərbçilərin sayını artırır

ABŞ 2027-ci ildə silahlı qüvvələrinin şəxsi heyətini daha da artırmağı planlaşdırır. "RIA Novosti"yə istinadən xəbər verir ki, bu barədə ölkənin müdafiə naziri Pit Heqset açıqlama verib. O bildirib ki, hazırda ABŞ ordusunda təxminən 1.8 milyon hərbçi xidmət edir və qarşıdakı dövrdə bu rəqəmi

24 may
.

Yaponiyada yemişlər hərracda rekord qiymətə satıldı

Yaponiyada becərilən bir cüt premium "Yubari" yemişi mövsümün ilk auksionunda rekord qiymətə - 5.8 milyon yenə (təqribən 36 500 ABŞ dolları) satılaraq 2019-cu ildə qeydə alınan beş milyon yenlik əvvəlki rekordu qırıb. xəbər verir ki, məlumatı "Japan Today" nəşri yayıb. Məhsulu Kusir

24 may
.

Hindistana yanacaq daşıyan tanker fevraldan bəri ilk dəfə Hörmüz boğazından keçib

Hindistan üçün nəzərdə tutulmuş mayeləşdirilmiş təbii qaz (LPG) daşıyan tanker ABŞ və İsrailin İrana qarşı müharibəsi başlayandan bəri ilk dəfə Hörmüz boğazından keçib. -ın məlumatına görə, bu barədə "Bloomberg" agentliyi dəniz daşımalarını izləyən şirkətlərin məlumatlarına istinadən xəbə

24 may
.

"Hyundai" 400 mindən çox avtomobili geri çağırır - SƏBƏB

Cənubi Koreyanın avtomobil istehsalçısı "Hyundai Motor" proqram təminatındakı xəta səbəbindən ABŞ-dən 421 mindən çox avtomobilini geri çağırır. xəbər verir ki, bu barədə ABŞ-nin Milli Yol Hərəkəti Təhlükəsizliyi İdarəsi məlumat yayıb. Məlumata görə, sözügedən problem avtomobillərdə qəfil v

23 may