Spring til indhold

Datalingvistik: Forskelle mellem versioner

Fra Wikipedia, den frie encyklopædi
Content deleted Content added
NoDaLiDa-link
 
(24 mellemliggende versioner af 17 andre brugere ikke vist)
Linje 1: Linje 1:
{{Ingen kilder|dato=marts 2018}}[[File:Automated online assistant.png|thumb|Kommunikation fra computer til en (for)bruger]]
'''Datalingvistik''' er den videnskabelige disciplin der beskæftiger sig med [[natursprogsbehandling]] i mennesker og navnlig computere. Datalingvistik har dermed som underdiscipliner den datamatiske behandling af '''[[Fonetik|fonetiske]]/[[fonologi]]ske''', '''[[morfologi]]ske''' og '''[[Syntaks|syntaktiske]]''' data samt '''diskursdata'''. Disse data er henholdsvis (sprog)lyde, orddele, ord og sætninger og deres organisering. Da natursprogsbehandling også dækker '''formel semantik og logik''', er dette også emner inden for datalingvistikken.
'''Datalingvistik''' er den videnskabelige disciplin der beskæftiger sig med [[natursprogsbehandling]] i mennesker og navnlig computere. Datalingvistik har dermed som underdiscipliner den datamatiske behandling af [[Fonetik|fonetiske]]/[[fonologi]]ske, [[Morfologi (lingvistik)|morfologi]]ske og [[Syntaks|syntaktiske]] data samt diskursdata. Disse data er henholdsvis (sprog)lyde, orddele, ord og sætninger og deres organisering. Da natursprogsbehandling også dækker formel semantik og logik, er dette også emner inden for datalingvistikken.


En af datalingvistikkens hovedformål har traditionelt været at opstille [[formel grammatik|formelle grammatikker]] for forskellige aspekter af sproget, dvs. regelsæt der definerer fx den uendelige mængde af et sprogs grammatisk korrekte sætninger uden at overgeneralisere til ugrammatiske sætninger. Tilsvarende regel-baserede modeller har været tilstræbt for diverse andre [[Lingvistik|sprogstrukturelle]] fænomener.
En af datalingvistikkens hovedformål har traditionelt været at opstille [[formel grammatik|formelle grammatikker]] for forskellige aspekter af sproget, dvs. regelsæt der definerer fx den uendelige mængde af et sprogs grammatisk korrekte sætninger uden at overgeneralisere til ugrammatiske sætninger. Tilsvarende regel-baserede modeller har været tilstræbt for diverse andre [[Lingvistik|sprogstrukturelle]] fænomener.


De mange undtagelser der altid findes til formelle regler man kan stille op for sproglige fænomener har imidlertid ført til en dalende interesse for formelle grammatikker til fordel for undersøgelser af faktiske forekommende sproglige mønstre i store tekstsamlinger (kaldet [[Korpus|korpora]]). Datalingvistikken har dermed taget en drejning hen imod ''datadreven'' eller ''statistisk'' natursprogsbehandling og [[korpuslingvistik]].
De mange undtagelser der altid findes til formelle regler man kan stille op for sproglige fænomener har imidlertid ført til en dalende interesse for formelle grammatikker til fordel for undersøgelser af faktiske forekommende sproglige mønstre i store tekstsamlinger (kaldet [[Tekstkorpus|korpora]]). Datalingvistikken har dermed taget en drejning hen imod ''datadreven'' eller ''statistisk'' natursprogsbehandling og [[korpuslingvistik]].


== Se også ==
* [[NoDaLiDa]]


<!--
* [http://cst.ku.dk/ Center for Sprogteknologi]
* [http://www.cst.dk/sprogteknologi/index.html "Hvad er sprogteknologi?"] – Center for Sprogteknologis definition.
* [http://en.wikipedia.org/w/index.php?title=Natural_language_processing "Natural Language Processing"] – Artikel i den engelsksprogede Wikipedia
* [http://en.citizendium.org/wiki/Computational_linguistics "Computational linguistics"] – Artikel i Citizendium
* [http://www.dr.dk/P1/harddisken/Udsendelser/2006/11/2007/01/26133819.htm Oversættelse med kunstig intelligens] – Radioudsendelse 27. januar 2007 kl. 20:30 på P1, Harddisken: Programmer der oversætter fra andre sprog til dansk eller engelsk, åbner internettet endnu mere end i dag. I følge Daniel Hardt der forsker i dataoversættelse på CBS så er programmerne lige om hjørnet. Med den nyeste teknik er det computeren der selv retter sig selv – altså en slags kunstig intelligens. Jeanette Ørsted er translatør i firmaet Plougmann & Vingtoft der arbejder med patenter, fortæller hvordan hun bruger dataoversættelse i sit daglige arbejde
-->
== Eksterne henvisninger ==
* [http://www.aclweb.org/ ACL] {{Webarchive|url=https://web.archive.org/web/20080725085506/http://aclweb.org/aclwiki/ |date=25. juli 2008 }} – Association for Computational Linguistics.
* [http://eacl.coli.uni-saarland.de/page.php?id=index EACL] {{Webarchive|url=https://web.archive.org/web/20080513040530/http://eacl.coli.uni-saarland.de/page.php?id=index |date=13. maj 2008 }} – ACL, European Chapter.
* [http://omilia.uio.no/nealt/ NEALT] {{Webarchive|url=https://web.archive.org/web/20080614070938/http://omilia.uio.no/nealt/ |date=14. juni 2008 }} – North European Association for Language Technology.
* [http://www.ling.ohio-state.edu/acl08/ ACL] {{Webarchive|url=https://web.archive.org/web/20080606091302/http://www.ling.ohio-state.edu/acl08/ |date= 6. juni 2008 }} – Association for Computational Linguistics' årlige konference.
* [http://folli.loria.fr/esslli.php ESSLLI] {{Webarchive|url=https://web.archive.org/web/20080418012554/http://folli.loria.fr/esslli.php |date=18. april 2008 }} – European Summer School in Language, Logic, and Information. Årlig sommerskole.


<!--
<!--
==Afsnit==

==Afsnit==

==Afsnit==




* [http://cst.ku.dk/ Center for Sprogteknologi]
* [http://cst.ku.dk/ Center for Sprogteknologi]
* [http://www.cst.dk/sprogteknologi/index.html "Hvad er sprogteknologi?"] - Center for Sprogteknologis definition.
* [http://www.cst.dk/sprogteknologi/index.html "Hvad er sprogteknologi?"] Center for Sprogteknologis definition.
* [http://en.wikipedia.org/w/index.php?title=Natural_language_processing "Natural Language Processing"] - Artikel i den engelsksprogede Wikipedia
* [http://en.wikipedia.org/w/index.php?title=Natural_language_processing "Natural Language Processing"] Artikel i den engelsksprogede Wikipedia
* [http://en.citizendium.org/wiki/Computational_linguistics "Computational linguistics"] - Artikel i Citizendium
* [http://en.citizendium.org/wiki/Computational_linguistics "Computational linguistics"] Artikel i Citizendium
* [http://www.dr.dk/P1/harddisken/Udsendelser/2006/11/2007/01/26133819.htm Oversættelse med kunstig intelligens] - Radioudsendelse 27. januar 2007 kl. 20:30 på P1, Harddisken: Programmer der oversætter fra andre sprog til dansk eller engelsk, åbner internettet endnu mere end i dag. I følge Daniel Hardt der forsker i dataoversættelse på CBS så er programmerne lige om hjørnet. Med den nyeste teknik er det computeren der selv retter sig selv - altså en slags kunstig intelligens. Jeanette Ørsted er translatør i firmaet Plougmann & Vingtoft der arbejder med patenter, fortæller hvordan hun bruger dataoversættelse i sit daglige arbejde
* [http://www.dr.dk/P1/harddisken/Udsendelser/2006/11/2007/01/26133819.htm Oversættelse med kunstig intelligens] Radioudsendelse 27. januar 2007 kl. 20:30 på P1, Harddisken: Programmer der oversætter fra andre sprog til dansk eller engelsk, åbner internettet endnu mere end i dag. I følge Daniel Hardt der forsker i dataoversættelse på CBS så er programmerne lige om hjørnet. Med den nyeste teknik er det computeren der selv retter sig selv altså en slags kunstig intelligens. Jeanette Ørsted er translatør i firmaet Plougmann & Vingtoft der arbejder med patenter, fortæller hvordan hun bruger dataoversættelse i sit daglige arbejde
-->
-->


{{autoritetsdata}}
==Eksterne links==
* [http://www.aclweb.org/ ACL] - Association for Computational Linguistics.
* [http://eacl.coli.uni-saarland.de/page.php?id=index EACL] - ACL, European Chapter.
* [http://omilia.uio.no/nealt/ NEALT] - North European Association for Language Technology.


* [http://www.ling.ohio-state.edu/acl08/ ACL] - Association for Computational Linguistics' årlige konference.
* [http://folli.loria.fr/esslli.php ESSLLI] - European Summer School in Language, Logic, and Information. Årlig sommerskole.
* [http://math.ut.ee/nodalida2007/ NODALIDA] - Nordiske DataLingvistik Dage. Nordisk sprogteknologikonference hvert andet år.


[[Kategori:Videregående uddannelser i Danmark]]
[[Kategori:Videregående uddannelser i Danmark]]
Linje 39: Linje 38:
[[Kategori:Sprogforskning]]
[[Kategori:Sprogforskning]]
[[Kategori:Natursprogsbehandling|*]]
[[Kategori:Natursprogsbehandling|*]]
[[Kategori:Formelle videnskaber]]

[[en:Computational Linguistics]]

Nuværende version fra 6. jun. 2023, 17:23

Kommunikation fra computer til en (for)bruger

Datalingvistik er den videnskabelige disciplin der beskæftiger sig med natursprogsbehandling i mennesker og navnlig computere. Datalingvistik har dermed som underdiscipliner den datamatiske behandling af fonetiske/fonologiske, morfologiske og syntaktiske data samt diskursdata. Disse data er henholdsvis (sprog)lyde, orddele, ord og sætninger og deres organisering. Da natursprogsbehandling også dækker formel semantik og logik, er dette også emner inden for datalingvistikken.

En af datalingvistikkens hovedformål har traditionelt været at opstille formelle grammatikker for forskellige aspekter af sproget, dvs. regelsæt der definerer fx den uendelige mængde af et sprogs grammatisk korrekte sætninger uden at overgeneralisere til ugrammatiske sætninger. Tilsvarende regel-baserede modeller har været tilstræbt for diverse andre sprogstrukturelle fænomener.

De mange undtagelser der altid findes til formelle regler man kan stille op for sproglige fænomener har imidlertid ført til en dalende interesse for formelle grammatikker til fordel for undersøgelser af faktiske forekommende sproglige mønstre i store tekstsamlinger (kaldet korpora). Datalingvistikken har dermed taget en drejning hen imod datadreven eller statistisk natursprogsbehandling og korpuslingvistik.

Eksterne henvisninger

[redigér | rediger kildetekst]