From Wikipedia, the free encyclopedia
Karen Spärck Jones (Huddersfield, 1935eko abuztuaren 26 – Willingham, 2007ko apirilaren 4) Erresuma Batuko zientzialaria eta informatikaria izan zen Hizkuntzalaritza konputazionalean ekarpen handia egin zuena.
Karen Spärck Jones | |
---|---|
Bizitza | |
Jaiotza | Huddersfield, 1935eko abuztuaren 26a |
Herrialdea | Erresuma Batua |
Heriotza | Willingham (en) eta Cambridgeshire, 2007ko apirilaren 4a (71 urte) |
Heriotza modua | berezko heriotza: minbizia |
Familia | |
Ezkontidea(k) | Roger Michael Needham (en) (1958ko ekainaren 10a - |
Hezkuntza | |
Heziketa | Girton College (en) Cambridgeko Unibertsitatea |
Tesi zuzendaria | DC Comics R. B. Braithwaite (en) |
Hizkuntzak | ingelesa |
Jarduerak | |
Jarduerak | informatikaria, unibertsitateko irakaslea eta artificial intelligence researcher (en) |
Enplegatzailea(k) | Newnham College Wolfson College |
Jasotako sariak | ikusi
|
Kidetza | Britainiar Akademia Association for the Advancement of Artificial Intelligence (en) |
cl.cam.ac.uk… |
Informazioa eskuratzea alorrean ikertzaile aitzindaria izan zen.
Karen Spärck Huddersfielden jaio zen Erresuma Batuko Mendebaldeko Yorkshire konderrian.
Bere aita Owen Jones izan zen, kimikako irakasle bat, eta bere ama Ida Spärck izan zen, Norvegiatik Erresuma Batura Bigarren Mundu Gerran alde egin zuena. Spärck Jones Huddersfieldeko eskola batean ikasi zuen, eta gero Cambridgeko Girton Collegen 1953tik 1956raino, Historia estudiatu zuen eta gero Filosofia urte gehigarri batean.
Orduan maisu lanean hasi zen eskola batean, baina laster hasi zen informatikan lan egiten. Informatikan lanean ari izan zen denbora guztian nabarmen sustatu zuen emakume gehiago diziplina honetan sar zitezen. Adibidez, berea da aipu hau:
« | Informatikan emakume gehiago sartzea oso garratzitsua dela uste dut. Nire leloa da hau: Informatika garrantzitsuegia da gizonezkoen eskuetan uzteko. I think it's very important to get more women into computing. My slogan is: Computing is too important to be left to men. |
» |
Karen Spärck Jones |
Beren ikerbidea 1950ean hasi zen, tesaurus bat sortzen parte hartu zuen Cambridgeko Unibertsitateko Hizkuntzaren Azterketarako ikerketa-unitatean.
1964an aurkeztu zuen bere doktorego-tesia, "Sinonimia eta sailkapen semantikoa" izenburua zuena, teknika estatistiko eta probabilistikoak teknika linguistikoekin konbinatuta.[1] Tesiaren planteamendua aitzindaria izan zen bere arloan.
EHUko Informatika Fakultatean izan zen 1990ko irailean, IXA taldeak gonbidatuta. SEPLN elkartearen urte hartako kongresuan. Bere hitzaldia Erresuma Batuan Hizkuntzaren prozesamenduaren arloan indarrean zeuden programa nazionalei buruzkoa izan zen. Hitzaldiaren edukia Procesamiento del Lenguaje Natural aldizkarian argitaratu zen, 1992ko urtarrilean.[2]
Informazioa eskuratzearen arloan ikertzen jarraitu ahal izan zuen Royal Society eta Biblioteka Britainiarra instituzioetatik eman zizkioten bekei esker. 1974tik 2002an erretiratu zen arte Cambridgeko Unibertsitateko Informatika Laborategian lan egin zuen, baita gero ere 2007an minbiziagatik hil zen arte.
Roger Needhamekin ezkonduta egon zen 1958tik honen heriotzaraino 2003an.
Karen Spärck Jonesek indexazio automatizatuaren garapena lideratu zuen, dokumentu batean hitz bakoitzak duen garrantzia informatiboa aurkitzeko adierazle bat asmatu zuen; harrezkero "indexazio pisatua" edo pisu bidezkoa izenarekin ezagutuko zena.
ITF izena duen algoritmo hau (Inverse Term Frecuency edo terminoaren alderantzizko maiztasuna) termino batek dokumentu batean duen garrantzia kalkulatzen du dokumentuan agertzen den aldi kopuruaren arabera eta horren erlazioa gainerako terminoen kopuruarekin. Algoritmo honek baztertzen ditu gehiegitan agertzen diren hitzak (hizkuntzaren hitz funtzionalak, esaterako preposizioak edo elkartzeak) eta gutxiegitan agertzen direnak (agerraldi gutxi batzuk dituztenak), dokumentuaren edukia deskribatzeko balio informatzaile nahikoa ez dutelakoan.
Adierazle honek are garrantzitsuagoa izan zen beste berri bati zabaldu zion bidea: IDF (Inverse Document Frecuency edo dokumentuaren alderantzizko maiztasuna). Aurrekoaren antzekoa zena baina datu-base dokumental bateko dokumentu guztietan kalkulatzen da. Interneteko bilatzaile batean, adibidez, kontsulta bati erantzuteko aurkitu diren dokumentuak lortuta, normalean algoritmo horrekin aztertzen dira, dokumentuak beren garrantziaren arabera ordenatzeko. Gaur egunean Interneten eta datu-base dokumentaletan bilaketa asko eta asko egiten direnez, nabaria da Karen Spark Jonesek eta Stephen Robertsonek asmatu zuten algoritmo honen garrantzia itzela dela
Beste ikertzaile batzuek algoritmoa hobetu dute geroago ere: Keith van Rijsbergen, Peter Ingwersen edo Ricardo Baeza-yates.
Bere obren batzuk dira honakoak:
Ikerketako aldizkari zientifikotan artikulu ugari argitaratu zituen, horien artean ondokoak:
Sari ugariekin saritu zuten, haien artean:
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.