Çindən süni intellekt sahəsində sensasion YENİLİK

Çindən süni intellekt sahəsində sensasion YENİLİKÇinin süni intellekt sahəsində fəaliyyət göstərən startapı DeepSeek, sensasion bir açıqlama edərək, aparıcı süni intellekt şirkətlərinin modellərinə bənzər bir modeli 11 dəfə daha az hesablama gücü ilə hazırladıqlarını elan edib.

Lent.az xəbər verir ki, DeepSeek-in təqdim etdiyi məlumatlara görə, OpenAI, Meta və Anthropic kimi nəhənglərin modellərinə bənzər DeepSeek-V3 adlı dil modeli cəmi 2 ay ərzində 2.048 Nvidia H800 GPU-sundan ibarət bir qrup vasitəsilə 671 milyard parametr üzərində öyrədilib. Bu, təxminən 2.8 milyon GPU saatı deməkdir. Müqayisə üçün, Meta-nın 405 milyard parametrə malik Llama 3 modelini 54 gün ərzində 16.384 H100 GPU istifadə edərək öyrətməsi üçün 11 dəfə daha çox hesablama gücü (30.8 milyon GPU saatı) tələb olunub.

DeepSeek, qabaqcıl əlaqə xətti (pipeline) alqoritmləri, optimallaşdırılmış rabitə çərçivəsi və FP8 aşağı dəqiqlikli hesablama üsulundan istifadə edərək bu cür miqyaslı modellər üçün adətən tələb olunan hesablama və yaddaş ehtiyaclarını əhəmiyyətli dərəcədə azaltdığını iddia edir. Şirkət, DeepSeek-V3 modelinin hesablama tələblərini azaltmaq üçün onlarla optimizasiya texnikası tətbiq etdiyini vurğulasa da, bir neçə əsas texnologiya bu nəticələrin əldə olunmasında həlledici rol oynayıb. DeepSeek, DualPipe adlı alqoritmdən istifadə edərək həm hesablama, həm də rabitə mərhələlərində effektivliyi artırdığını bildirir. Bu alqoritm, xüsusilə MoE arxitekturasının tələb etdiyi qovşaqlararası ekspert paralelliyi üçün təlim darboğazlarını minimuma endirib. Beləliklə, sıfıra yaxın rabitə yükü ilə 14.8 trilyon simvolun işlənməsi mümkün olub.

Bundan əlavə, DeepSeek rabitə zamanı istifadə olunan qovşaqların sayını hər simvol üçün maksimum 4 qovşaqla məhdudlaşdırıb. Bu yanaşma trafiki azaldıb və rabitənin hesablama ilə effektiv şəkildə üst-üstə düşməsinə imkan verib. Performans baxımından, şirkət DeepSeek-V3 MoE modelinin bəzi göstəricilər üzrə GPT-4x, Claude-3.5-Sonnet və LLama-3.1 modelləri ilə müqayisə edilə bilən, bəzən isə onları ötüb, keçən nəticələr verdiyini bildirir. Lakin bu iddiaların müstəqil tədqiqatçılar tərəfindən təsdiqlənməsinə ehtiyac var. Şirkət modeli və onun parametrlərini açıq mənbə kimi təqdim edib, buna görə də yaxın vaxtlarda müqayisəli testlərin aparılması gözlənilir.

DeepSeek-V3 modeli parametrlərin sayı və ya məntiqi düşünmə qabiliyyətləri baxımından GPT-4 və ya Llama-3 kimi qabaqcıl modellərdən geri qalsa da, məhdud resurslarla yüksək səviyyəli bir MoE modelinin hazırlanmasının mümkün olduğunu nümayiş etdirir. Təbii ki, bu, çoxlu optimizasiya və aşağı səviyyəli proqramlaşdırma tələb edir, lakin nəticələr olduqca ümidverici görünür. DeepSeek komandası, DeepSeek-V3 modelinin tətbiqinin inkişaf etmiş avadanlıqla yanaşı, prefilling və dekodlaşdırma mərhələlərini bir-birindən ayıran xüsusi paylama strategiyası tələb etdiyini, bunun isə resurs çatışmazlığı səbəbindən kiçik şirkətlər üçün əlçatmaz ola biləcəyini etiraf edir.


Sonxeber.az
Telegramda izləyin
Dünyada   Baxılıb: 912   Tarix: 28 dekabr 2024  

Şikayətiniz varsa Whatsapp: 077 7125666

Facebookda Paylaş


Oxşar xəbərlər

.

İran Müdafiə Nazirliyinin yüksəkvəzifəli şəxsi öldürülüb

İran Müdafiə Nazirliyinin tədqiqat mərkəzinin rəhbəri Əli Fuladvənd İsrail-ABŞ birgə əməliyyatı nəticəsində ölkənin Borucerd şəhərində həlak olub. "Report" xəbər verir ki, bu barədə "Al Hadath" telekanalı məlumat yayıb. Qeyd olunub ki, Əli Fuladvand İran Müdafiə Nazirliyinin Müdafi

29 mart
.

Çində yığılmış yarım milyon "Toyota" geri çağırılacaq: Ciddi qüsur aşkarlandı

"Toyota" şirkəti Çində yığılmış 560 min avtomobili geri çağıracaq. xəbər verir ki, araşdırma zamanı Çində "GAC Group" və "FAW Group" ilə birgə müəssisələrdə istehsal olunan avtomobillərdə arxa oturacaqlarla bağlı potensial təhlükəli qüsur aşkarlanıb. Məlumata görə, oturacaqları

29 mart
.

Çin sürətlə su anbarları inşa edir: Bunun arxasında nə dayanır?

Çin elektrik enerjisini toplamaq məqsədilə yeni su anbarlarını sürətlə inşa edir. Ölkə külək və günəş enerjisini sürətlə inkişaf etdirir, lakin Pekinin əsas məqsədi bu enerjinin günəş olmadığı və külək əsdiyi vaxtlarda da əlçatan olmasını təmin etməkdir. Məhz buna görə Çin hidroakkumulyasiya elektri

1 aprel
.

Paşinyan yenidən Baş nazir postuna namizədi oldu

Ermənistanda "Vətəndaş müqaviləsi" partiyasının daxili səsvermənin iki mərhələsinin yekunları açıqlanıb. Qaynarinfo-nun məlumatına görə, bu barədə Paşinyan sosial şəbəkələrdə yazıb. Baş nazir bildirib ki, səsvermənin nəticələrinə görə onun namizədliyi hökumət başçısı postuna irəli sürülüb

30 mart
.

Putin Paşinyanla görüşdü - Yenilənib

Rusiya Prezidenti Vladimir Putin Moskvada səfərdə olan Ermənistanın Baş naziri Nikol Paşinyanla görüşür. "Qafqazinfo" TASS-a istinadən xəbər verir ki, tərəflər arasında keçirilən danışıqlarda Rusiya-Ermənistan strateji tərəfdaşlığının mövcud vəziyyəti və gələcək perspektivləri diqqət mərkəzindədir

1 aprel
.

ÜTT üzvləri arasındakı saziş milli qanunvericiliyə uyğun tətbiq ediləcək

Avstraliya, Çin, Böyük Britaniya və Avropa İttifaqı (Aİ) daxil olmaqla dünya ticarətinin 70 faizini təmsil edən Ümumdünya Ticarət Təşkilatının (ÜTT) üzvləri öz aralarındakı sazişi milli qanunvericiliklərində tətbiq edəcək. "Report" xəbər verir ki, bu barədə "Politico" məlumat yayıb

29 mart
.

Dubayda İranın hücumlarını lentə alan onlarla ingilis saxlanıldı

Təxminən 70 Böyük Britaniya vətəndaşı Birləşmiş Ərəb Əmirlikləri ərazisində İranın atdığı raketlərdən sonra yaranan dağıntılar foto və videolarını çəkdiklərinə görə "sərt qanunlar" çərçivəsində saxlanılıb. xarici mediaya istinadla xəbər verir ki, Dubayda yaşayan hüquq müdafiəçisi Radha Stirlinqi

30 mart
.

Polşada sirli hadisə: Meşəyə naməlum obyekt düşdü

Polşanın şərqində yerləşən Minsk-Mazovetski şəhəri yaxınlığında uçan naməlum obyektin (UNO) düşməsi qeydə alınıb. "RMF FM"ə istinadən xəbər verir ki, obyekt Minsk-Mazovetski yaxınlığındakı Rudnik qəsəbəsinin meşəlik ərazisinə düşüb. Bildirilib ki, hadisə yaşayış məntəqələrindən xeyli uzaqd

29 mart
.

Kim Çen In Şimali Koreyanın xüsusi təyinatlı qüvvələrini yoxlayıb

Şimali Koreya lideri Kim Çen In xüsusi təyinatlı qüvvələrin təlim bazasına baş çəkib və müasir taktiki silahların sınaqlarının şahidi olub. "Report" xəbər verir ki, bu barədə dövlət xəbər agentliyi KCNA məlumat yayıb. Kim yeni əsas döyüş tankının sınaqlarını da izləyib. Agentliyin məlumatın

29 mart