22 aprel 2026-cı il tarixində "OpenAI" şirkəti təsvirlərin generasiyası üçün nəzərdə tutulmuş "ChatGPT Images 2.0" modelini nümayiş etdirib. Bu yenilik kütləvi süni intellekt sistemləri arasında ilk dəfə olaraq şəkillərdəki mətnləri tam düzgün şəkildə əks etdirmək qabiliyyətinə malikdir. Artıq istifadəçilər heç bir əlavə redaktəyə ehtiyac duymadan üzərində oxunaqlı yazılar olan qrafik materiallar yarada biləcəklər.
Əvvəlki modellərdə hansı problemlər var idi?
Hələ 2024-cü ildə diffuziya əsaslı süni intellekt modelləri yazıları mütəmadi olaraq təhrif edirdi. Məsələn, "Microsoft Designer" ("DALL-E 3" əsaslı) kimi sistemlər "Enchidas" və ya "Churiros" kimi uydurma sözlər yaradırdı. "Lesan AI" şirkətinin qurucusu və baş direktoru Asmelaş Teka Hadqunun (Asmelash Teka Hadgu) sözlərinə görə, bu cür modellər təsviri küydən bərpa edərkən əsas pikselləri mənimsəyir, mətn isə ümumi sahənin çox kiçik bir hissəsini təşkil etdiyi üçün diqqətdən kənarda qalırdı. Tədqiqatçılar bu problemi həll etmək üçün böyük dil modellərinə (LLM) bənzər avtoreqressiv yanaşmaları sınaqdan keçiriblər.
"ChatGPT Images 2.0" necə işləyir?
"OpenAI" yeni modelin arxitekturasını tam açıqlamasa da, onun mühakimə yürütmək qabiliyyətinə malik olduğunu bildirib. Sistem internetdə məlumat axtara, bir sorğu əsasında bir neçə təsvir yarada və nəticələri yenidən yoxlaya bilir. Bu xüsusiyyətlər sayəsində müxtəlif ölçülü marketinq materialları və hətta komikslər hazırlamaq mümkündür. Bundan əlavə, yapon, Koreya, hind və benqal kimi qeyri-latın şriftləri ilə işləmək bacarığı da əhəmiyyətli dərəcədə təkmilləşdirilib. Lakin modelin məlumat bazası dekabr 2025-ci il tarixi ilə məhdudlaşır.
İstifadəçiləri nələr gözləyir?
Şirkətin mətbuat açıqlamasında qeyd olunur ki, yeni sistem detalların dəqiqliyini misilsiz səviyyəyə qaldırır. Model mürəkkəb kompozisiyaları düşünərək həyata keçirə, kiçik mətnləri, piktoqramları və interfeys elementlərini 2K icazəsinə qədər qüsursuz çəkə bilir. Generasiya prosesi adi mətn sorğularından bir qədər çox vaxt aparsa da, çoxpanelli bir komiksin yaradılması cəmi bir neçə dəqiqə çəkir.
Yenilikdən bütün "ChatGPT" və "Codex" istifadəçiləri yararlana biləcəklər. Ödənişli abunəçilər üçün daha mürəkkəb təsvirlərin yaradılması imkanı nəzərdə tutulub. Həmçinin, "OpenAI" tərtibatçılar üçün "gpt-image-2" proqram interfeysini (API) də istifadəyə verəcək ki, buradakı qiymətləndirmə çıxış faylının keyfiyyətindən və icazəsindən asılı olacaq.






