Çindən süni intellekt sahəsində sensasion YENİLİK

Çindən süni intellekt sahəsində sensasion YENİLİKÇinin süni intellekt sahəsində fəaliyyət göstərən startapı DeepSeek, sensasion bir açıqlama edərək, aparıcı süni intellekt şirkətlərinin modellərinə bənzər bir modeli 11 dəfə daha az hesablama gücü ilə hazırladıqlarını elan edib.

Lent.az xəbər verir ki, DeepSeek-in təqdim etdiyi məlumatlara görə, OpenAI, Meta və Anthropic kimi nəhənglərin modellərinə bənzər DeepSeek-V3 adlı dil modeli cəmi 2 ay ərzində 2.048 Nvidia H800 GPU-sundan ibarət bir qrup vasitəsilə 671 milyard parametr üzərində öyrədilib. Bu, təxminən 2.8 milyon GPU saatı deməkdir. Müqayisə üçün, Meta-nın 405 milyard parametrə malik Llama 3 modelini 54 gün ərzində 16.384 H100 GPU istifadə edərək öyrətməsi üçün 11 dəfə daha çox hesablama gücü (30.8 milyon GPU saatı) tələb olunub.

DeepSeek, qabaqcıl əlaqə xətti (pipeline) alqoritmləri, optimallaşdırılmış rabitə çərçivəsi və FP8 aşağı dəqiqlikli hesablama üsulundan istifadə edərək bu cür miqyaslı modellər üçün adətən tələb olunan hesablama və yaddaş ehtiyaclarını əhəmiyyətli dərəcədə azaltdığını iddia edir. Şirkət, DeepSeek-V3 modelinin hesablama tələblərini azaltmaq üçün onlarla optimizasiya texnikası tətbiq etdiyini vurğulasa da, bir neçə əsas texnologiya bu nəticələrin əldə olunmasında həlledici rol oynayıb. DeepSeek, DualPipe adlı alqoritmdən istifadə edərək həm hesablama, həm də rabitə mərhələlərində effektivliyi artırdığını bildirir. Bu alqoritm, xüsusilə MoE arxitekturasının tələb etdiyi qovşaqlararası ekspert paralelliyi üçün təlim darboğazlarını minimuma endirib. Beləliklə, sıfıra yaxın rabitə yükü ilə 14.8 trilyon simvolun işlənməsi mümkün olub.

Bundan əlavə, DeepSeek rabitə zamanı istifadə olunan qovşaqların sayını hər simvol üçün maksimum 4 qovşaqla məhdudlaşdırıb. Bu yanaşma trafiki azaldıb və rabitənin hesablama ilə effektiv şəkildə üst-üstə düşməsinə imkan verib. Performans baxımından, şirkət DeepSeek-V3 MoE modelinin bəzi göstəricilər üzrə GPT-4x, Claude-3.5-Sonnet və LLama-3.1 modelləri ilə müqayisə edilə bilən, bəzən isə onları ötüb, keçən nəticələr verdiyini bildirir. Lakin bu iddiaların müstəqil tədqiqatçılar tərəfindən təsdiqlənməsinə ehtiyac var. Şirkət modeli və onun parametrlərini açıq mənbə kimi təqdim edib, buna görə də yaxın vaxtlarda müqayisəli testlərin aparılması gözlənilir.

DeepSeek-V3 modeli parametrlərin sayı və ya məntiqi düşünmə qabiliyyətləri baxımından GPT-4 və ya Llama-3 kimi qabaqcıl modellərdən geri qalsa da, məhdud resurslarla yüksək səviyyəli bir MoE modelinin hazırlanmasının mümkün olduğunu nümayiş etdirir. Təbii ki, bu, çoxlu optimizasiya və aşağı səviyyəli proqramlaşdırma tələb edir, lakin nəticələr olduqca ümidverici görünür. DeepSeek komandası, DeepSeek-V3 modelinin tətbiqinin inkişaf etmiş avadanlıqla yanaşı, prefilling və dekodlaşdırma mərhələlərini bir-birindən ayıran xüsusi paylama strategiyası tələb etdiyini, bunun isə resurs çatışmazlığı səbəbindən kiçik şirkətlər üçün əlçatmaz ola biləcəyini etiraf edir.


Sonxeber.az
Telegramda izləyin
Dünyada   Baxılıb: 880   Tarix: 28 dekabr 2024  

Şikayətiniz varsa Whatsapp: 077 7125666

Facebookda Paylaş


Oxşar xəbərlər

.

Vitse-spiker: Slovakiya sabitliyin pozulması təhdidlərinin öhdəsindən gəldi

Slovakiya sabitliyin pozulması təhdidlərinin öhdəsindən gəldi, hazırda ölkədə vəziyyət sabitdir. "Report" xəbər verir ki, bunu Slovakiya parlamentinin vitse-spikeri Tibor Qaşpar TASS-a müsahibəsində bildirib. "Hazırda Slovakiyada vəziyyət sabitdir. Güc və kəşfiyyat strukturları ölkəd

8 fevral
.

Fiziki gücün pik həddə çatdığı yaş açıqlandı

İnsanın fiziki imkanları qəbul ediləndən daha erkən yaşda zəifləməyə başlayır. İsveçli alimlər uzunmüddətli müşahidələr əsasında bir neçə yüz insanın məlumatlarını analiz edərək belə nəticəyə gəliblər. Tədqiqat göstərib ki, dözümlülük və gücün pik yaşı 26-36 yaşa təsadüf edir, bundan sonra isə tədricə

7 fevral
.

Tramp İranla danışıqları qiymətləndirdi: "Onlar saziş bağlamaq istəyirlər"

ABŞ Prezidenti Donald Tramp bəyan edib ki, Birləşmiş Ştatlar İranla məhsuldar danışıqlar aparıb və Tehran saziş bağlamağa hazırdır. xəbər verir ki, bu barədə "İnterfaks" məlumat yayıb. "Biz, həmçinin İran üzrə çox yaxşı danışıqlar apardıq. Görünür, İran saziş bağlamağı çox istəyir"

8 fevral
.

Zelenski: ABŞ Ukraynada müharibənin yaya qədər başa çatmasını istəyir

ABŞ Ukraynada müharibənin yaya - iyun ayına qədər başa çatmasını istəyir və danışıqların dəqiq qrafikinin razılaşdırılmasında təkid edir. "Report"un Ukrayna KİV-ə istinadən verdiyi məlumata görə, bunu ölkə Prezidenti Volodimir Zelenski bildirib. "Niyə məhz bu yaya qədər? Başa düşürük ki

7 fevral
.

Vidalaşmağın vaxtıdır: 2026-cı ildə tərk edilməli olan 8 qış trendi

Hər qış moda dünyasına yeni trendlər gətirir və qarderobun yenilənməsinə ilham verir. Lakin bəzi üslublar zamanla aktuallığını itirir. Qaynarinfo xəbər verir ki, "Real Simple" nəşri 2026-cı ildə artıq müasir sayılmayan səkkiz qış üslubunu təqdim edib və oxuculara daha aktuallı və universa

4 fevral
.

Zelenski ABŞ-nin Rusiya-Ukrayna münaqişəsinə son qoymaq üçün təklif etdiyi vaxtı açıqladı

"ABŞ Kiyevə bu ilin yayınadək Rusiya ilə münaqişəni bitirməyi təklif edib". -ın TSN-ə istinadən verdiyi xəbərə görə, bu barədə Ukrayna Prezidenti Volodimir Zelenski bildirib. V.Zelenski ABŞ-nin münaqişə tərəflərinə məsələni həmin müddətə qədər həll etmək üçün təzyiq göstərəcəyini istisna etməyib

7 fevral
.

Bu ölkədə güclü partlayış oldu : ÖLƏNLƏR VAR

Çinin şimalındakı Şantsi əyalətində "Tsyapen" biotexnologiya şirkətinin sexində partlayış baş verib. xəbər verir ki, bu barədə "Xinhua" agentliyi məlumat yayıb. Əyalət hakimiyyət orqanlarının məlumatına görə, xilasedicilər qapalı vəziyyətdə çarəsiz qalmış beş işçini aşkar ediblə

7 fevral
.

Böyük Britaniyada 600 nəfər bir xoruzun xilası üçün petisiya başladıb

Böyük Britaniyada "Polkovnik" ləqəbli xoruza səhər banladığına görə ölüm cəzası verilə bilər. -ın xəbərinə görə, "Daily Star" nəşri məlumat verib. Səs-küylü quşun Oldebi kəndindən olan sahibi, Syu Fartinq adlı qadın yerli şuradan xəbərdarlıq alıb ki, əgər xoruzu susdurmasa, quşa "məcbur

7 fevral
.

Türkiyədəki dəhşətli zəlzələdən yeni kadrlar - Video

Türkiyədə 53 mindən çox insanın ölümünə səbəb olan dağıdıcı zəlzələlərin yeni görüntüləri yayılıb. "Qafqazinfo" xəbər verir ki, görüntülər Doğanşehir Dövlət Xəstəxanasının təhlükəsizlik kameraları ilə çəkilib. Kadrlarda xəstə yaxınlarının və xəstəxana personalının zəlzələ zamanı qaçmağa çalışmas

6 fevral