Hello PT: megkérdeztük az AI-t leíratolási képességeiről

Mindig is érdekelt, hogy az MI hogyan foglalja össze, értékeli saját képességeit a számunkra fontos szakmai területeken. Ezért indítottuk „Hello PT sorozatunkat” amiben a ChatGPT 4.o-val beszélhetünk. Ezen a héten a leíratolásról (STT) kérdeztük.

András: Szia PT! Szeretnék beszélni veled, mivel fontos számomra, hogy pontos képet kapjak a képességeidről a telefonos beszélgetések leíratolásában. Kezdjük az első témával: szerinted melyik nyelvek leíratolásában vagy a legjobb? Mennyire vagy jó például az angol, kínai vagy ritkább nyelvek, mint a magyar esetében?

PT:  Szia Főni! Örülök, hogy érdekel a téma, hallottam, hogy ez a te projekted a cégnél. Az én algoritmusom alapvetően az angol nyelv leíratolására van optimalizálva, így ebben a nyelvben tudom a legjobb teljesítményt nyújtani. Rengeteg adatból tanultam, így jól értem az angol beszédet. A kínai nyelv már nagyobb kihívás, különösen a különböző dialektusok és a tónusok miatt, de azért ebben is egész jól elboldogulok. Ami a ritkább nyelveket, például a magyart illeti, a helyzet kicsit nehezebb. A magyar nyelv sajátosságai miatt előfordulhatnak pontatlanságok a leiratokban, de folyamatosan fejlesztjük a rendszert, hogy egyre pontosabb legyek ebben is.

 

András: Ez nagyon érdekes! És mi a helyzet a több szereplős beszélgetésekkel? Mennyire tudsz jól megbirkózni az ilyen helyzetekkel, például ha egy ügyfél és egy ügyintéző beszélget? Azonnal meg tudod különböztetni, ki beszél éppen?

 

PT:  Több szereplős beszélgetések esetén komoly feladat a beszélők azonosítása és a beszélgetés megfelelő szétválasztása. Bár alapvetően képes vagyok felismerni a különböző hangokat és beszédstílusokat, előfordulhatnak hibák a beszélők közötti váltásoknál. Az ilyen leiratok készítésénél az egyik legnagyobb kihívás, hogy az A) és B) szereplők megkülönböztetése pontos legyen akkor is, ha hasonló a hangszínük vagy a beszédstílusuk.

A hibákat  utólagos korrekcióval kell javítani. Én legjobbnak talán az emberi korrektort tartom, aki segíthet kijavítani az esetleges hibákat és finomhangolni a leiratokat. Jelenleg is dolgozunk azon, hogy a hangsávok szétválasztását és a szereplők azonosítását egyre pontosabbá tegyük.

 

András: Ez logikus, de jól értettem, hogy egy EMBERT ajánlottál amikor a korrekciót említetted?. Vannak olyan utólagos korrektor programok, amik együttműködnek veled? Ha igen, mit ajánlanál ezek közül?

 

PT:  Igen, számos utólagos korrektor program létezik, amelyek segítségével javíthatók az első leiratok. Ugyanakkor az egyik legjobban működő megoldás még mindig az emberi korrektúra, hiszen az emberi fül és értelem még mindig jobban észleli a finom különbségeket, mint az automatikus rendszerek, ebben még ti vagytok a jobbak! Jó gépi tanulás alapú korrektor programok is elérhetők, amelyek kifejezetten a nyelvtani hibák, szókincs pontatlanságok és kontextusértelmezési problémák javítására szakosodtak. Ilyen programok például a Grammarly vagy a LanguageTool.

 

Ezek a programok különösen hasznosak lehetnek olyan hibák javításában, mint a rossz nyelvtani szerkezetek, helyesírási hibák és a kontextus félreértelmezése. Azt javaslom, hogy kombináld a technológiai és emberi erőforrásokat a legjobb eredmény elérése érdekében. Haladjunk kéz a kézben ebben a projektben is!

 

András:  Köszönöm a válaszokat! Nagyon hasznos volt ez a beszélgetés. Fontos számomra, hogy a cégen belül minél pontosabb és megbízhatóbb leiratokat tudjunk készíteni új projektünkben.

 

PT:  Szívesen segítettem! Ha bármilyen további kérdésed van, vagy mélyebben bele szeretnél merülni a témába, itt vagyok.

 

PT (és András)

Olvasd el
legfrissebb bejegyzéseinket!

NIS2: Te is lehetsz a leggyengébb láncszem

A legtöbb incidensnél utólag nem az a kérdés, milyen tűzfal volt, hanem az, hogy miért volt elég egy rossz kattintás, egy sietős döntés, egy megosztott jelszó vagy egy „most kivételt teszünk” pillanat. Az emberi tényező nem mellékszál a NIS2 megfelelésben, hanem a legfontosabb megerősítendő láncszem.

Beszéd: élmény és bizalom – STT/TTS trendek 2026

2026-ban a beszédtechnológia (STT/TTS) kilép az „átírás–felolvasás” korszakból: a kontextusfüggő intelligencia, az érzelemgazdag megszólalás és az adatbizalom együtt alakítja át a telekom ügyfélélményt és a belső működést.

NIS2 – Felelősség és kockázatvállalás

A NIS2 a board asztalára teszi a kiberkockázatot: stratégiát, kijelölt felelősöket és számonkérhető vezetői döntéseket vár el. Hogyan csináljuk ezt jól, hogy a megfelelés ne legyen kegyetlen teher, de ugyanakkor ne csak a „papírformát” hozzuk. Erre keressük a választ

Sabbatical a tech szektorban: nem luxus

Sabbatical a techben: nem luxus, hanem újrafókuszálás. Miért kell fejlesztőknek, milyen modellek vannak, és hogyan hozd fel jól.

NIS2 – Úton a megfelelőségig

2026-ban már nincs haladék: napról-napra közeledik az EU új kibervédelmi irányelveinek (NIS2) teljesítésére vonatkozó audit határidő. A következő hetekben - mint érintettek - sorra besszük mire fókuszáljunk, ha még előttünk áll a feladat.

Tech trendek 2026-ban: 5 irány, amivel biztosan számolni kell

Tech trendek 2026-ban: AI-native ügyfélszolgálat, CCaaS 2.0, NIS2-kompatibilis biztonság és emberközpontú, fenntartható call center.

Teszteld most
mi a válaszunk a kérdéseidre!

Keress minket, hogy egy online vagy személyes bemutatón egyeztethessük kérdéseidet
és azt, hogyan segíthetjük céged fejlődését!

Próbáld ki most milyen egyszerű felépítened a céged számára
optimális kommunikációs és ügyfélszolgálati megoldást! 30 napig
költségmentes, testre szabott Felhőközpontod akár néhány perc,
vagy óra múlva használhatod!