Hello PT: megkérdeztük az AI-t leíratolási képességeiről

Mindig is érdekelt, hogy az MI hogyan foglalja össze, értékeli saját képességeit a számunkra fontos szakmai területeken. Ezért indítottuk „Hello PT sorozatunkat” amiben a ChatGPT 4.o-val beszélhetünk. Ezen a héten a leíratolásról (STT) kérdeztük.

András: Szia PT! Szeretnék beszélni veled, mivel fontos számomra, hogy pontos képet kapjak a képességeidről a telefonos beszélgetések leíratolásában. Kezdjük az első témával: szerinted melyik nyelvek leíratolásában vagy a legjobb? Mennyire vagy jó például az angol, kínai vagy ritkább nyelvek, mint a magyar esetében?

PT:  Szia Főni! Örülök, hogy érdekel a téma, hallottam, hogy ez a te projekted a cégnél. Az én algoritmusom alapvetően az angol nyelv leíratolására van optimalizálva, így ebben a nyelvben tudom a legjobb teljesítményt nyújtani. Rengeteg adatból tanultam, így jól értem az angol beszédet. A kínai nyelv már nagyobb kihívás, különösen a különböző dialektusok és a tónusok miatt, de azért ebben is egész jól elboldogulok. Ami a ritkább nyelveket, például a magyart illeti, a helyzet kicsit nehezebb. A magyar nyelv sajátosságai miatt előfordulhatnak pontatlanságok a leiratokban, de folyamatosan fejlesztjük a rendszert, hogy egyre pontosabb legyek ebben is.

 

András: Ez nagyon érdekes! És mi a helyzet a több szereplős beszélgetésekkel? Mennyire tudsz jól megbirkózni az ilyen helyzetekkel, például ha egy ügyfél és egy ügyintéző beszélget? Azonnal meg tudod különböztetni, ki beszél éppen?

 

PT:  Több szereplős beszélgetések esetén komoly feladat a beszélők azonosítása és a beszélgetés megfelelő szétválasztása. Bár alapvetően képes vagyok felismerni a különböző hangokat és beszédstílusokat, előfordulhatnak hibák a beszélők közötti váltásoknál. Az ilyen leiratok készítésénél az egyik legnagyobb kihívás, hogy az A) és B) szereplők megkülönböztetése pontos legyen akkor is, ha hasonló a hangszínük vagy a beszédstílusuk.

A hibákat  utólagos korrekcióval kell javítani. Én legjobbnak talán az emberi korrektort tartom, aki segíthet kijavítani az esetleges hibákat és finomhangolni a leiratokat. Jelenleg is dolgozunk azon, hogy a hangsávok szétválasztását és a szereplők azonosítását egyre pontosabbá tegyük.

 

András: Ez logikus, de jól értettem, hogy egy EMBERT ajánlottál amikor a korrekciót említetted?. Vannak olyan utólagos korrektor programok, amik együttműködnek veled? Ha igen, mit ajánlanál ezek közül?

 

PT:  Igen, számos utólagos korrektor program létezik, amelyek segítségével javíthatók az első leiratok. Ugyanakkor az egyik legjobban működő megoldás még mindig az emberi korrektúra, hiszen az emberi fül és értelem még mindig jobban észleli a finom különbségeket, mint az automatikus rendszerek, ebben még ti vagytok a jobbak! Jó gépi tanulás alapú korrektor programok is elérhetők, amelyek kifejezetten a nyelvtani hibák, szókincs pontatlanságok és kontextusértelmezési problémák javítására szakosodtak. Ilyen programok például a Grammarly vagy a LanguageTool.

 

Ezek a programok különösen hasznosak lehetnek olyan hibák javításában, mint a rossz nyelvtani szerkezetek, helyesírási hibák és a kontextus félreértelmezése. Azt javaslom, hogy kombináld a technológiai és emberi erőforrásokat a legjobb eredmény elérése érdekében. Haladjunk kéz a kézben ebben a projektben is!

 

András:  Köszönöm a válaszokat! Nagyon hasznos volt ez a beszélgetés. Fontos számomra, hogy a cégen belül minél pontosabb és megbízhatóbb leiratokat tudjunk készíteni új projektünkben.

 

PT:  Szívesen segítettem! Ha bármilyen további kérdésed van, vagy mélyebben bele szeretnél merülni a témába, itt vagyok.

 

PT (és András)

Olvasd el
legfrissebb bejegyzéseinket!

NIS2 pipa: 95% – „jelentős” besorolás mellett is

Van az a pillanat, amikor hónapok munkája egyetlen mondatban sűrűsödik össze: átmentünk. Ráadásul nem is „épphogy”, hanem 95%-kal, kimagasló eredménnyel – úgy, hogy a minősített rendszerünk a magyar jogszabályok szerint „jelentős” besorolású

A vállalati működés agya: CRM és kommunikáció 2026

A CRM sok cégnél még mindig muszáj nyilvántartás: valahol vannak ügyfelek, kontaktok, pár jegyzet. 2026-ban viszont a CRM akkor ad igazi értéket, ha operációs agyként működik. Összefogja az ügyfélképet, segíti a döntést, és automatizálja a rutint. Úgy, hogy közben átlátható marad.

API-first ügyfélszolgálat 2026

Sokan még mindig úgy gondolnak a telefonos ügyfélszolgálatra, mint egy elszigetelt csatornára: felveszed a hívást, beszélsz, leteszed. 2026-ban viszont a jól működő ügyfélszolgálat inkább egy integrációs központ. A hívás nem csak beszélgetés, hanem egy esemény, ami elindít (vagy lezár) folyamatokat a háttérrendszerekben.

NIS2: beszállított kockázat

Lehet tökéletes a saját védelmed, ha közben egy fejlesztő partner, egy üzemeltető vagy egy adatközpont rés a láncban. A NIS2 feltételeinek teljesítésében a beszállítóid főszereplők: a te kockázatod része és az auditor is így fogja nézni.

Újgenerációs TTS: a hang újra stratégiai eszköz

Ha eddig a TTS-t (Text-to-Speech) csak „felolvasó gombnak” láttad, 2026-ban érdemes újra ránézni. Az új generációs modellek képesek tempót, hangsúlyt, szünetet és érzelmi árnyalatot is kezelni. Ezért lett a hang újra stratégiai terület és eszköz a céges kommunikációban.

NIS2: Te is lehetsz a leggyengébb láncszem

A legtöbb incidensnél utólag nem az a kérdés, milyen tűzfal volt, hanem az, hogy miért volt elég egy rossz kattintás, egy sietős döntés, egy megosztott jelszó vagy egy „most kivételt teszünk” pillanat. Az emberi tényező nem mellékszál a NIS2 megfelelésben, hanem a legfontosabb megerősítendő láncszem.

Teszteld most
mi a válaszunk a kérdéseidre!

Keress minket, hogy egy online vagy személyes bemutatón egyeztethessük kérdéseidet
és azt, hogyan segíthetjük céged fejlődését!

Próbáld ki most milyen egyszerű felépítened a céged számára
optimális kommunikációs és ügyfélszolgálati megoldást! 30 napig
költségmentes, testre szabott Felhőközpontod akár néhány perc,
vagy óra múlva használhatod!