Çindən süni intellekt sahəsində sensasion YENİLİK

Çindən süni intellekt sahəsində sensasion YENİLİKÇinin süni intellekt sahəsində fəaliyyət göstərən startapı DeepSeek, sensasion bir açıqlama edərək, aparıcı süni intellekt şirkətlərinin modellərinə bənzər bir modeli 11 dəfə daha az hesablama gücü ilə hazırladıqlarını elan edib.

Lent.az xəbər verir ki, DeepSeek-in təqdim etdiyi məlumatlara görə, OpenAI, Meta və Anthropic kimi nəhənglərin modellərinə bənzər DeepSeek-V3 adlı dil modeli cəmi 2 ay ərzində 2.048 Nvidia H800 GPU-sundan ibarət bir qrup vasitəsilə 671 milyard parametr üzərində öyrədilib. Bu, təxminən 2.8 milyon GPU saatı deməkdir. Müqayisə üçün, Meta-nın 405 milyard parametrə malik Llama 3 modelini 54 gün ərzində 16.384 H100 GPU istifadə edərək öyrətməsi üçün 11 dəfə daha çox hesablama gücü (30.8 milyon GPU saatı) tələb olunub.

DeepSeek, qabaqcıl əlaqə xətti (pipeline) alqoritmləri, optimallaşdırılmış rabitə çərçivəsi və FP8 aşağı dəqiqlikli hesablama üsulundan istifadə edərək bu cür miqyaslı modellər üçün adətən tələb olunan hesablama və yaddaş ehtiyaclarını əhəmiyyətli dərəcədə azaltdığını iddia edir. Şirkət, DeepSeek-V3 modelinin hesablama tələblərini azaltmaq üçün onlarla optimizasiya texnikası tətbiq etdiyini vurğulasa da, bir neçə əsas texnologiya bu nəticələrin əldə olunmasında həlledici rol oynayıb. DeepSeek, DualPipe adlı alqoritmdən istifadə edərək həm hesablama, həm də rabitə mərhələlərində effektivliyi artırdığını bildirir. Bu alqoritm, xüsusilə MoE arxitekturasının tələb etdiyi qovşaqlararası ekspert paralelliyi üçün təlim darboğazlarını minimuma endirib. Beləliklə, sıfıra yaxın rabitə yükü ilə 14.8 trilyon simvolun işlənməsi mümkün olub.

Bundan əlavə, DeepSeek rabitə zamanı istifadə olunan qovşaqların sayını hər simvol üçün maksimum 4 qovşaqla məhdudlaşdırıb. Bu yanaşma trafiki azaldıb və rabitənin hesablama ilə effektiv şəkildə üst-üstə düşməsinə imkan verib. Performans baxımından, şirkət DeepSeek-V3 MoE modelinin bəzi göstəricilər üzrə GPT-4x, Claude-3.5-Sonnet və LLama-3.1 modelləri ilə müqayisə edilə bilən, bəzən isə onları ötüb, keçən nəticələr verdiyini bildirir. Lakin bu iddiaların müstəqil tədqiqatçılar tərəfindən təsdiqlənməsinə ehtiyac var. Şirkət modeli və onun parametrlərini açıq mənbə kimi təqdim edib, buna görə də yaxın vaxtlarda müqayisəli testlərin aparılması gözlənilir.

DeepSeek-V3 modeli parametrlərin sayı və ya məntiqi düşünmə qabiliyyətləri baxımından GPT-4 və ya Llama-3 kimi qabaqcıl modellərdən geri qalsa da, məhdud resurslarla yüksək səviyyəli bir MoE modelinin hazırlanmasının mümkün olduğunu nümayiş etdirir. Təbii ki, bu, çoxlu optimizasiya və aşağı səviyyəli proqramlaşdırma tələb edir, lakin nəticələr olduqca ümidverici görünür. DeepSeek komandası, DeepSeek-V3 modelinin tətbiqinin inkişaf etmiş avadanlıqla yanaşı, prefilling və dekodlaşdırma mərhələlərini bir-birindən ayıran xüsusi paylama strategiyası tələb etdiyini, bunun isə resurs çatışmazlığı səbəbindən kiçik şirkətlər üçün əlçatmaz ola biləcəyini etiraf edir.


Sonxeber.az
Telegramda izləyin
Dünyada   Baxılıb: 865   Tarix: 28 dekabr 2024  

Şikayətiniz varsa Whatsapp: 077 7125666

Facebookda Paylaş


Oxşar xəbərlər

.

Almaniyada hərbi xidmətin yeni modeli təsdiq edildi

Bundesrat (federal ştatların nümayəndələr palatası) Bundestaqdan (parlament) sonra Almaniyada hərbi xidmətin yeni modeli haqqında qanun layihəsini təsdiqləyib. DPA agentliyinə istinadən xəbər verir ki, qanun 2026-cı il yanvarın 1-dən qüvvəyə minəcək. Beləliklə, Almaniya Bundesverin (Almaniya Silahl

21 dekabr
.

Handedən sonra məşhur aktrisa ilə sevgili oldu

Türkiyəli iş adamı Hakan Sabancı qısa aradan sonra eşıq həyatı ilə gündəmə gəlib. Axşam.az xəbər verir ki, iş adamının aktrisa Rabia Soytürklə münasibətdə olduğu bildirlib. Cütlüyün artıq iki həftədir eşq yaşadığı iddia olunub. Qeyd edək ki, Hakan bundan əvvəl aktrisa Hande Erçellə sevgili olub. Onla

21 dekabr
.

Argentinanın keçmiş prezidenti xəstəxanaya yerləşdirildi

Argentinanın ev həbsində olan keçmiş prezidenti Kristina Fernandes de Kirşner qarın nahiyəsindəki ağrı səbəbilə xəstəxanaya yerləşdirilib. bildirir ki, bu barədə "La Nacion" qəzeti mənbələrə istinadən xəbər verir. Xəstəxanada Fernandes de Kirşnerə appendisit diaqnozu qoyulub. O, əməliyyat edilib

21 dekabr
.

Çinin ən böyük dəniz neft-qaz yatağı hasilat rekordu müəyyənləşdirdi

Çinin Milli Neft Korporasiyası (CNOOC) bu il Bohay neft-qaz yatağında rekord səviyyədə - 40 milyon ton neft və qaz hasilatı qeydə alıb. bu barədə "Xinhua" agentliyinə istinadən xəbər verir. Bildirilib ki, sözügedən göstəricinin artması qismən "Kenli 10-2" və "Boçjun 26-6"

21 dekabr
.

Kaya Kallas üzr istədi

Estoniya məhkəməsinin böhtan iddiası ilə bağlı qərarından sonra Avropa İttifaqı diplomatiyasının rəhbəri Kaya Kallas "Facebook" səhifəsində rəsmi üzrxahlıq mesajı yerləşdirib. xəbər verir ki, bu barədə "EADaily" məlumat yayıb. Nəşrin məlumatına görə, Estoniya məhkəməsi Kallasa Ail

21 dekabr
.

İsrail Ordusu Qəzzada iki yaraqlının zərərsizləşdirildiyini bildirib

İsrailin Hərbi Hava Qüvvələri Qəzza zolağının şimalında iki yaraqlını zərərsizləşdirib. "Report"un "Ynet"ə istinadən məlumatına görə, bu barədə İsrail Ordusunun mətbuat xidməti xəbər verib. Məlumata görə, yaraqlılar Qəzza zolağının şimalında "sarı xətt"i keçdikdən və Qüd

21 dekabr
.

Gəzməyə gedən 4 uşaq YOXA ÇIXDI

Rusiyada uşaqların kütləvi şəkildə yoxa çıxması ilə bağlı müəmmalı hadisə baş verib. xəbər verir ki, dekabrın 21-də Samara vilayətində polislər gəzintidən sonra evə qayıtmayan dörd uşağın axtarışına çıxıblar. Daxili İşlər Nazirliyinin regional bölməsinin məlumatına görə, onlar Bezençuk kəndinin sakinlər

21 dekabr
.

Nəvə kommunal borclara görə nənəsini öldürdü

Rusiyanın Kalininqrad vilayətində nəvə nənəsini öldürüb. yerli mediaya istinadla bildirir ki, istintaqın məlumatına görə, yetkin yaşlı nəvə 80 yaşlı nənəsi ilə birgə yaşayırmış. Qadın mütəmadi olaraq pensiyaçı nənəsini döyür və ona qarşı zorakılıq edirmiş. Günlərin birində qohumlar arasında növbəti mübahis

21 dekabr
.

Polşalı qadının söylədiyi sözləri gündəm oldu: 123 illik tarixi xatırlatdı

Polşalı bir qadının türklər haqqında sosial şəbəkədə paylaşdığı fikirlər geniş rezonans doğurub. türk mediasına istinadən xəbər verir ki, tarixi bir məqama diqqət çəkən qadın bildirib ki, ölkəsi 123 il boyunca dünya xəritəsində yer almasa da, Osmanlı Dövləti Polşanın mövcudluğunu tanımaqda davam edib

22 dekabr