Clarino-logo
Corpuscle :: ASK Hovedkorpus :: Metadata
ASK - The Norwegian Second Language Corpus
Full metadata record:
Persistent identifier for the resource:
Contact Person: ,
This resource is licensed under the following terms:
CLARIN_RES-PRIV
BY ID NORED PERM PLAN PRIV
BY ID NORED PERM PLAN PRIV
Please click on the link to read the license terms.
This resource has a restricted license.
You may apply for access by filling in the form on this page.
Attribution:
Tenfjord, Kari; Meurer, Paul; Hofland, Knut. The ASK Corpus – A Language Learner Corpus of Norwegian as a Second Language. Proceedings from 5th International Conference on Language Resources and Evaluation (LREC), Genova 2006. URL http://www.lrec- conf.org/proceedings/lrec2006/pdf/573_pdf
Size: 1129799 tokens , 769892 words , 1936 texts
Language(s): Norwegian bokmål (nb), Norwegian (no)
Description:
ASK is an electronic, searchable text corpus of Norwegian as a second language, with links between linguistic data and personal data.

Ask was established by the Norwegian Second Language Corpus project.

The corpus contains written texts produced by language learners from ten different language backgrounds: German, Dutch, English, Spanish, Russian, Polish, Bosnian-Croatian-Serbian, Albanian, Vietnamese and Somali. The size of the corpus and the flexible query system make it possible to develop a new methodological approach to the study of transfer when the L2 is Norwegian.

The selection of texts is primarily based on the native language of the test takers, and the typological distribution of these languages is taken into consideration. A corpus of Norwegian as a second language makes it possible to use quantitative methods in second language research, and provides a basis for pedagogical developments.

ACCESS: the material is available in searchable form via the corpus search engine Corpuscle (see links in metadata). One can enter the ASK corpus directly via the Corpuscle main page, or using a direct link to this specific corpus via the ASK project page. Four texts of the material have also been uploaded and parsed as a small treebank in INESS.
Norsk andrespråkskorpus (ASK) er et elektronisk, søkbart tekstkorpus for norsk som andrespråk med mulighet for kobling mellom språkdata og persondata.

Dataene hentes fra Norsk språktests arkiv over innvandrere som har tatt Språkprøven i norsk for voksne innvandrere og Test i norsk – høyere nivå. Utvalget av tekster er i første rekke gjort på grunnlag av testtakernes morsmål, og de ulike morsmålene har en typologisk spredning. I tillegg har vi hentet inn tekster av samme type skrevet av språkbrukere med norsk som morsmål. Kodingen av tekstene genererer et parallellkorpus av de originale tekstene i samsvar med norsk skriftnorm.

Søkesystemet er fleksibelt og gjør det mulig å søke etter for eksempel feilkategorier, ord, lemma, strenger av ord, strenger av ord og ordklasser og ulike kombinasjoner av disse. Et elektronisk andrespråkskorpus gir grunnlag for kvantitative metoder i andrespråksforskningen, for eksplorative undersøkelser, og det kan gi grunnlag for pedagogisk utviklingsarbeid.