Çindən süni intellekt sahəsində sensasion YENİLİK

Çindən süni intellekt sahəsində sensasion YENİLİKÇinin süni intellekt sahəsində fəaliyyət göstərən startapı DeepSeek, sensasion bir açıqlama edərək, aparıcı süni intellekt şirkətlərinin modellərinə bənzər bir modeli 11 dəfə daha az hesablama gücü ilə hazırladıqlarını elan edib.

Lent.az xəbər verir ki, DeepSeek-in təqdim etdiyi məlumatlara görə, OpenAI, Meta və Anthropic kimi nəhənglərin modellərinə bənzər DeepSeek-V3 adlı dil modeli cəmi 2 ay ərzində 2.048 Nvidia H800 GPU-sundan ibarət bir qrup vasitəsilə 671 milyard parametr üzərində öyrədilib. Bu, təxminən 2.8 milyon GPU saatı deməkdir. Müqayisə üçün, Meta-nın 405 milyard parametrə malik Llama 3 modelini 54 gün ərzində 16.384 H100 GPU istifadə edərək öyrətməsi üçün 11 dəfə daha çox hesablama gücü (30.8 milyon GPU saatı) tələb olunub.

DeepSeek, qabaqcıl əlaqə xətti (pipeline) alqoritmləri, optimallaşdırılmış rabitə çərçivəsi və FP8 aşağı dəqiqlikli hesablama üsulundan istifadə edərək bu cür miqyaslı modellər üçün adətən tələb olunan hesablama və yaddaş ehtiyaclarını əhəmiyyətli dərəcədə azaltdığını iddia edir. Şirkət, DeepSeek-V3 modelinin hesablama tələblərini azaltmaq üçün onlarla optimizasiya texnikası tətbiq etdiyini vurğulasa da, bir neçə əsas texnologiya bu nəticələrin əldə olunmasında həlledici rol oynayıb. DeepSeek, DualPipe adlı alqoritmdən istifadə edərək həm hesablama, həm də rabitə mərhələlərində effektivliyi artırdığını bildirir. Bu alqoritm, xüsusilə MoE arxitekturasının tələb etdiyi qovşaqlararası ekspert paralelliyi üçün təlim darboğazlarını minimuma endirib. Beləliklə, sıfıra yaxın rabitə yükü ilə 14.8 trilyon simvolun işlənməsi mümkün olub.

Bundan əlavə, DeepSeek rabitə zamanı istifadə olunan qovşaqların sayını hər simvol üçün maksimum 4 qovşaqla məhdudlaşdırıb. Bu yanaşma trafiki azaldıb və rabitənin hesablama ilə effektiv şəkildə üst-üstə düşməsinə imkan verib. Performans baxımından, şirkət DeepSeek-V3 MoE modelinin bəzi göstəricilər üzrə GPT-4x, Claude-3.5-Sonnet və LLama-3.1 modelləri ilə müqayisə edilə bilən, bəzən isə onları ötüb, keçən nəticələr verdiyini bildirir. Lakin bu iddiaların müstəqil tədqiqatçılar tərəfindən təsdiqlənməsinə ehtiyac var. Şirkət modeli və onun parametrlərini açıq mənbə kimi təqdim edib, buna görə də yaxın vaxtlarda müqayisəli testlərin aparılması gözlənilir.

DeepSeek-V3 modeli parametrlərin sayı və ya məntiqi düşünmə qabiliyyətləri baxımından GPT-4 və ya Llama-3 kimi qabaqcıl modellərdən geri qalsa da, məhdud resurslarla yüksək səviyyəli bir MoE modelinin hazırlanmasının mümkün olduğunu nümayiş etdirir. Təbii ki, bu, çoxlu optimizasiya və aşağı səviyyəli proqramlaşdırma tələb edir, lakin nəticələr olduqca ümidverici görünür. DeepSeek komandası, DeepSeek-V3 modelinin tətbiqinin inkişaf etmiş avadanlıqla yanaşı, prefilling və dekodlaşdırma mərhələlərini bir-birindən ayıran xüsusi paylama strategiyası tələb etdiyini, bunun isə resurs çatışmazlığı səbəbindən kiçik şirkətlər üçün əlçatmaz ola biləcəyini etiraf edir.


Sonxeber.az
Telegramda izləyin
Dünyada   Baxılıb: 911   Tarix: 28 dekabr 2024  

Şikayətiniz varsa Whatsapp: 077 7125666

Facebookda Paylaş


Oxşar xəbərlər

.

Polşada sirli hadisə: Meşəyə naməlum obyekt düşdü

Polşanın şərqində yerləşən Minsk-Mazovetski şəhəri yaxınlığında uçan naməlum obyektin (UNO) düşməsi qeydə alınıb. "RMF FM"ə istinadən xəbər verir ki, obyekt Minsk-Mazovetski yaxınlığındakı Rudnik qəsəbəsinin meşəlik ərazisinə düşüb. Bildirilib ki, hadisə yaşayış məntəqələrindən xeyli uzaqd

29 mart
.

Ayaqlarımızın altında 640 kilometr dərinlikdə nəhəng bir okean gizlənirmiş

Yer üzündə suyun hekayəsindən danışarkən adətən mavi okeanlar, gur axan çaylar və ya torpağın səthinə yaxın şirin su mənbələri yada düşür. Lakin yeni bir kəşf bu ənənəvi təsəvvürləri kökündən dəyişə bilər. Qaynarinfo-nun məlumatına görə, Nortvestern və Nyu Meksika universitetlərinin tədqiqatçıları tərəfində

31 mart
.

Putin Paşinyanla görüşdü - Yenilənib

Rusiya Prezidenti Vladimir Putin Moskvada səfərdə olan Ermənistanın Baş naziri Nikol Paşinyanla görüşür. "Qafqazinfo" TASS-a istinadən xəbər verir ki, tərəflər arasında keçirilən danışıqlarda Rusiya-Ermənistan strateji tərəfdaşlığının mövcud vəziyyəti və gələcək perspektivləri diqqət mərkəzindədir

1 aprel
.

Antarktidada sensasion kəşf: İki milyon illik buz izinə rast gəlindi

Rusiya tədqiqatçıları Antarktida qitəsində, Vostok stansiyasının yaxınlığında yaşı təqribən 2 milyon ilə çatan ən qədim buz qatının mövcud ola biləcəyi zonanı aşkar ediblər. xəbər verir ki, bu barədə məlumatı TASS-a Arktika və Antarktika Elmi-Tədqiqat İnstitutunun rəhbəri Aleksandr Makarov verib. Onu

29 mart
.

Rusiyada zavodda partlayış - 3 ölü, 58 yaralı - Yenilənib

Rusiyanın Nijnekamsk şəhərində "Nijnekamskneftexim" zavodunda partlayış və ardınca yanğın baş verib. "Qafqazinfo" "Kommersant"a istinadən xəbər verir ki, hadisə nəticəsində 1 nəfər həlak olub, daha 50 nəfər isə yaralanıb. Hazırda yanğının söndürülməsi istiqamətində iş aparılır

31 mart
.

54 ildən sonra aya ilk uçuş gerçəkləşdi

ABŞ-ın Aeronavtika və Kosmik Fəzanın Tədqiqatı üzrə Milli İdarəsinin (NASA) dörd astronavtını daşıyan insanlı "Orion" kosmik gəmisi ilə "Space Launch System" (SLS) raket daşıyıcı Aya uçub. "Report"un məlumatına görə, yarım əsrdən çox müddətdə Yer kürəsinin təbii peykin

2 aprel
.

Şahzadə İzabella əsgər gedir

Danimarkada qadınlar üçün məcburi hərbi xidmət tətbiq olunduqdan sonra Şahzadə İzabella tarixi bir qərar verib. "Qafqazinfo"nun məlumatına görə, yeni qanunlara əsasən, 18 yaşlı şahzadə hərbi xidmətdən azad edilmədən orduda xidmət edəcək. Şahzadə 2026-cı ilin avqustunda Slagelsedəki Mühafiz

1 aprel
.

Dubayda İranın hücumlarını lentə alan onlarla ingilis saxlanıldı

Təxminən 70 Böyük Britaniya vətəndaşı Birləşmiş Ərəb Əmirlikləri ərazisində İranın atdığı raketlərdən sonra yaranan dağıntılar foto və videolarını çəkdiklərinə görə "sərt qanunlar" çərçivəsində saxlanılıb. xarici mediaya istinadla xəbər verir ki, Dubayda yaşayan hüquq müdafiəçisi Radha Stirlinqi

30 mart
.

Makron Bərzaniyə zəng edərək dəstəyini bildirib

Fransa Prezidenti Emmanuel Makron İraq Kürdüstan Regionunun başçısı Neçirvan Bərzani ilə Dəhükdəki iqamətgahına edilən hücumdan sonra telefon danışığı aparıb. "Report" xəbər verir ki, bu barədə Fransa lideri "X" sosial media səhifəsində yazıb. Söhbət zamanı o, bu səhər iqamətgahın

29 mart