Texnologiya nəhəngi Google, səsli tərcümə sahəsində inqilabi yenilik olan Gemini 3.5 Live Translate modelini təqdim edib. Bu neyroşəbəkə 70-dən çox dili avtomatik tanıyaraq, tərcümə zamanı spikerin orijinal intonasiyasını, səs tonunu və danışıq tempini qoruyub saxlamaq qabiliyyətinə malikdir. Ənənəvi sistemlərdən fərqli olaraq, yeni alqoritm cümlənin bitməsini gözləmir və audio axınını sinxron şəkildə emal edir.
Bu texnologiya necə işləyir?
Sinxron tərcümə prosesi cəmi bir neçə saniyəlik gecikmə ilə həyata keçirilir ki, bu da dialoq zamanı yaranan süni fasilələrin qarşısını alır. Təhlükəsizlik məqsədilə Google, yaradılan bütün audiofaylları SynthID rəqəmsal nişanı ilə markalayır. Hazırda alət Gemini Live API və Google AI Studio vasitəsilə tərtibatçıların istifadəsinə verilib.
Hansı sahələrdə tətbiq olunacaq?
Yeni texnologiya artıq genişmiqyaslı sınaqlardan keçirilir. Məsələn, Grab taksi və çatdırılma xidməti sürücülər və müştərilər arasında ünsiyyəti asanlaşdırmaq üçün bu alətdən istifadə edir. Bundan əlavə, Google Meet platformasında 2000-dən çox dil kombinasiyası üzrə tərcümə imkanı təqdim ediləcək.
Yaxın gələcəkdə iOS və Android istifadəçiləri Google Translate tətbiqinin yenilənməsi ilə bu funksiyaya birbaşa çıxış əldə edəcəklər. Qulaqlıq vasitəsilə və ya Android cihazlar üçün nəzərdə tutulmuş xüsusi “dinləmə rejimi” ilə tərcüməni birbaşa eşitmək mümkün olacaq.






