Zure Bloga kudeatu

Sortu zure Bloga orain!

Martinezena

18/01/2009 GMT 1

Fikzio zientifikoa ala etorkizun soila?

martinez @ 11:16

Araceli Diaz de Lezana oso artikulu jakingarria plazaratu du www.erabili.com gunean. Euskarazko Informazioaren eta Komunikazioaren Teknologiaz (IKT) ari da eta interes handiz irakurri dut, IKTk izugarrizko lotura estua baitu hizkuntzarekin.

Artikulua oso-osorik irakurtzea merezi badu ere, azkeneko zatia izan zait niri deigarriena, etorkizunean garatuko diren hizkuntza-teknologiak aipatuta, pelikulero hutsa iruditu zait-eta. Laburtu egingo dizuet:

Ahotsaren teknologiak:

  • Eskuko telefonoak: datozen urteotan horietan ikusten dute enpresek negoziorik inportanteena. Aurreikuspenen arabera, hurrengo urteotan izugarri handituko da eskuko telefonoen kopurua. Beraz, sistemak garatu behar dira hizkuntza anitzetan zerbitzuak telefonoz emateko: negozioei buruzko informazioa, hirien egoerari buruzko datuak, helbideak, erosketak, erreserbak, eguraldia, telebistako programak, kirolak, jokoak... Sistema horiek eragina izango dute munduko biztanleriaren frakzio handi batean. Telefonoak Internetekin konparatuz gero, aplikazioak garatzeko orduan, hainbat informazio ematen du: pertsonaren generoa (emakumezkoa ala gizonezkoa), adina, heziketa-maila, arraza... Esaterako, esaten da emaitzak oso desberdinak direla gizonezkoekin edo emakumezkoekin erabiliz gero. Beraz, sistema horietan giltzarria izango da interfaze egokiak, multimodalak, egitea. Gainera, telefono bidezko zerbitzu horiek, itsuentzat esaterako, oso erabilgarriak izango dira.
  • Hitz egiteaz batera hizketa ulertzea (spoken language understanding), eta, gainera, komunikazio-zirkuitu eleanitz batean.
  • Ahotsa edo hizketa ezagutzea: ahotsa kontrolatzea, emozioak gehitzea, sistema interaktiboak garatzea...
  • Hizketatik hizketara itzulpena (Speech-to-Speech Translation): ahozko teknologia eta itzulpen automatikoaren teknologia erabilita.

Itzulpen automatikoa (Machine Translation MT)

Praktikak esaten du oso antzekoak diren hizkuntzen arteko itzulpenaren emaitzak oso onak direla (% 95); oso desberdinak diren hizkuntzen artean, berriz, emaitzak, oraingoz, ez dira onak (% 65 gehienez ere). Dena den, kalitatearen kontzeptua aldatzen ari da eta, orain, beste parametro batzuekin batera neurtu behar da, hau da, kantitatearekin eta prezioarekin. Itzulpen automatikoaren kontsumitzaileek ez dute perfekzioa bilatzen; bereziki, ulertzen ez duten testu baten inguruko gutxi gorabeherako informazioa nahi izaten dute lortu. Nahiago dute informazio inperfektua izatea, ezertxo ere ez izatea baino.

Beraz, planteamendua da, erabiltzeaz batera, modu kontrolatu batean, sistema hobetzen joatea, hots, kalitatearen kontrola egin behar da. Erantzuteko denbora ere neurtu behar da. Azken honetan, ebaluatze-sistemak (BLEU esaterako) erabiltzen ari dira itzulpen automatikoaren sistemak ebaluatzeko.

Informazioa berreskuratzea (Information retrieval)

Informazio garrantzitsua modu azkarrean eta eraginkorrean bilatzeko tresnak dira. Horretarako, hizkuntzak gurutzatu egiten dira, hau da bilaketa eleanitzak egin daitezke (cross-lingual retrieval). Hor kokatzen dira liburutegi digitalak ere, hau da hizkuntza desberdinak erabilita, munduko dokumentu inportanteak edo bestelako altxorrak erabiltzaileen eskura jartzeko sistemak. Teknologia honek galdera-erantzuna sistema erabiltzen du bai eta ontologiak eta thesaurusak ere. Informazioa erlazionatu, sailkatu eta laburtu egiten du. Azken finean, web semantikoaren teknologia da: kontzeptuak, entitateak eta gertaerak izaten ditu kontuan, egiturazko azterketak egiten ditu eta etiketa semantikoak jartzen ditu.

 

Internet

Orain gutxi pertsona batek esan zuen Internet dela "agora" berria. Hau da, Informazioaren eta Komunikazioaren aroak Interneten du ardatza. Azken urteotan Sarearen bilakaera azkarra ikusi dugu. Azkeneko honetan, web sozialetik (2.0) web semantikora (3.0) pasa gara. Gero eta eduki gehiago dago Interneten eta hizkuntza askotan. Beraz, eduki konplexu horiek kudeatzeko sistemak behar dira. Eta sistema horiek hizkuntza, makina bidez ikastea eta jakintza irudikatzeko teknologia behar dute testuinguru berrietan aplikatzeko. Semantikan oinarritzen dira, hau da, kontzeptuetan, kontzeptuen arteko erlazioetan, eta ondorioz ontologietan, thesaurusetan. Web semantikoan ere galdera-erantzuna sistema erabiltzen da. Esan behar da, Interneten eduki eta zerbitzuaren bereizketa desagertzen ari dela.

Lan ederra, beraz, behar-etzirako.

Erantzunak

Ez dago erantzunik »

Erantzun bat idatzi


<a href> <em> <blockquote> <strong> <cite> <code> <ul> <li> <dl> <dt> <dd>

Artxiboa | Sortu zure Bloga orain!