stimmenfryslan/notebooks/Martijn Format.ipynb

431 lines
9.5 KiB
Plaintext
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

{
"cells": [
{
"cell_type": "code",
"execution_count": 1,
"metadata": {},
"outputs": [],
"source": [
"with open('martijn_format/Dutch613-coordinates.txt') as f:\n",
" coordinates = list(f)\n",
" \n",
"with open('martijn_format/Nederlands-ipa.utxt') as f:\n",
" table = list(f)"
]
},
{
"cell_type": "code",
"execution_count": 9,
"metadata": {},
"outputs": [
{
"data": {
"text/plain": [
"['Aalsmeer NH', '4.76163', '52.2693\\n']"
]
},
"execution_count": 9,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"coordinates[1].split('\\t')"
]
},
{
"cell_type": "code",
"execution_count": 6,
"metadata": {},
"outputs": [
{
"data": {
"text/plain": [
"['',\n",
" 'kippen',\n",
" 'mijn',\n",
" 'vriend',\n",
" 'bloemen',\n",
" 'spinnen',\n",
" 'machines',\n",
" 'werk',\n",
" 'op',\n",
" 'schip',\n",
" 'kregen',\n",
" 'beschimmeld',\n",
" 'brood',\n",
" 'timmerman',\n",
" 'splinter',\n",
" 'vinger',\n",
" 'fabriek',\n",
" 'vier',\n",
" 'bier',\n",
" 'twee',\n",
" 'drie',\n",
" 'hij',\n",
" 'knuppel',\n",
" 'ik',\n",
" 'knie',\n",
" 'gezien',\n",
" 'ragebol',\n",
" 'pet',\n",
" 'paddestoel',\n",
" 'kerel',\n",
" 'brede',\n",
" 'stenen',\n",
" 'breder',\n",
" 'breedste',\n",
" 'standbeeld',\n",
" 'duivel',\n",
" 'gebleven',\n",
" 'meester',\n",
" 'zee',\n",
" 'graag',\n",
" 'keelpijn',\n",
" 'steel',\n",
" 'bezem',\n",
" 'neen',\n",
" 'geroepen',\n",
" 'peer',\n",
" 'rijp',\n",
" 'geld',\n",
" 'ver',\n",
" 'brengen',\n",
" 'vrouw',\n",
" 'zwemmen',\n",
" 'sterk',\n",
" 'bed',\n",
" 'optillen',\n",
" 'metselaar',\n",
" 'springen',\n",
" 'boterham',\n",
" 'vader',\n",
" 'zes',\n",
" 'jaar',\n",
" 'school',\n",
" 'laten',\n",
" 'gaan',\n",
" 'water',\n",
" 'potten',\n",
" 'zijn',\n",
" 'veel',\n",
" 'maart',\n",
" 'nog',\n",
" 'koud',\n",
" 'kaars',\n",
" 'geeft',\n",
" 'licht',\n",
" 'paard',\n",
" 'tegen',\n",
" 'zwaluwen',\n",
" 'kaas',\n",
" 'motor',\n",
" 'dag',\n",
" 'avond',\n",
" 'jongetje',\n",
" 'barst',\n",
" 'brief',\n",
" 'hart',\n",
" 'spannen',\n",
" 'nieuwe',\n",
" 'kar',\n",
" 'zoon',\n",
" 'koning',\n",
" 'ook',\n",
" 'geweest',\n",
" 'rozen',\n",
" 'lange',\n",
" 'woord',\n",
" 'kindje',\n",
" 'was',\n",
" 'dochtertje',\n",
" 'bos',\n",
" 'ladder',\n",
" 'mond',\n",
" 'droog',\n",
" 'dorst',\n",
" 'weg',\n",
" 'krom',\n",
" 'liedje',\n",
" 'goed',\n",
" 'kelder',\n",
" 'voor',\n",
" 'moest',\n",
" 'ossenbloed',\n",
" 'drinken',\n",
" 'broer',\n",
" 'moe',\n",
" 'karnemelk',\n",
" 'dun',\n",
" 'zuur',\n",
" 'put',\n",
" 'uur',\n",
" 'Italië',\n",
" 'bergen',\n",
" 'vuur',\n",
" 'spuwen',\n",
" 'duwen',\n",
" 'hebben',\n",
" 'stuk',\n",
" 'brug',\n",
" 'veulen',\n",
" 'komen',\n",
" 'deur',\n",
" 'naaien',\n",
" 'gras',\n",
" 'brouwer',\n",
" 'bakken',\n",
" 'je',\n",
" 'eieren',\n",
" 'krijgen',\n",
" 'markt',\n",
" 'waren',\n",
" 'vijf',\n",
" 'eikels',\n",
" 'hooi',\n",
" 'is',\n",
" 'groen',\n",
" 'boompje',\n",
" 'wijn',\n",
" 'huis',\n",
" 'melk',\n",
" 'spuit',\n",
" 'koe',\n",
" 'koster',\n",
" 'kruiwagen',\n",
" 'buigen',\n",
" 'Duitsers',\n",
" 'blauw',\n",
" 'geslagen',\n",
" 'saus',\n",
" 'flauw',\n",
" 'sneeuw',\n",
" 'stad',\n",
" 'doen',\n",
" 'dopen',\n",
" 'doopvont',\n",
" 'soldaten',\n",
" 'dorsen',\n",
" 'binden',\n",
" 'gebonden\\n']"
]
},
"execution_count": 6,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"table[0].split('\\t')"
]
},
{
"cell_type": "code",
"execution_count": 4,
"metadata": {},
"outputs": [
{
"data": {
"text/plain": [
"['West-Terschelling',\n",
" 'kipən',\n",
" 'miŋ',\n",
" 'kɑ̟mərɑ̟ːt',\n",
" 'blʊmə',\n",
" 'spɪnə',\n",
" 'məsinəs / məʃinəs',\n",
" 'ʋɔrə̆k',\n",
" 'ʊp̬',\n",
" 'sxɪp',\n",
" 'kreːɣə̃ / krɪɣə̃',\n",
" 'fəsxɪməlt / bəsxɪməlt',\n",
" 'bro̝ˑə̆t',\n",
" 'tɪmərmɑn',\n",
" 'splɪntər',\n",
" 'fɪŋər',\n",
" 'fəbrik',\n",
" 'fjɔŭwər',\n",
" 'biˑə̆r',\n",
" 'twɑ̟',\n",
" 'treːĭjə',\n",
" 'hɛĭ',\n",
" 'knʏpəl / ɛinhɔŭt',\n",
" 'ɪk',\n",
" 'knɪbəl',\n",
" 'siˑə̆n',\n",
" 'rɑ̟ːɣəbɔl',\n",
" 'pɛt',\n",
" 'pɑ̟dəstuˑə̆l',\n",
" 'mɑ̟n',\n",
" 'breːdə / breːjə',\n",
" 'stɪː',\n",
" 'breːdər',\n",
" 'breːstə',\n",
" 'stɔndbeːlt',\n",
" 'dyvəl',\n",
" 'blɔŭn',\n",
" 'meːstər',\n",
" 'seˑ',\n",
" 'xrɑːx',\n",
" 'ətĩˑsĩkeːl',\n",
" 'stɛːl',\n",
" 'biːzəm',\n",
" 'neː',\n",
" 'rɔft',\n",
" 'pɔˑə̆r',\n",
" 'rip',\n",
" 'jɪlt',\n",
" 'fiˑə̆r',\n",
" 'brɪŋə',\n",
" 'ʋiːf',\n",
" 'swʊmə',\n",
" 'stɛrk',\n",
" 'bɛˑə̆t',\n",
" 'ʊptɪlən',\n",
" '',\n",
" 'sprɪŋə',\n",
" '',\n",
" 'tɔ̞ˑə̆',\n",
" 'sɛks',\n",
" 'jiə̆r',\n",
" 'sxuˑəl',\n",
" 'lɪtn̩̆',\n",
" 'xeˑə̆̃',\n",
" 'ʋɛtər',\n",
" 'pɔtn̩̆',\n",
" 'bɪn',\n",
" 'fʊlə',\n",
" 'mɑˑə̆t',\n",
" 'nɔx',\n",
" 'kɔˑə̆t',\n",
" 'kɛs',\n",
" 'jʊxt',\n",
" 'jɛxt',\n",
" 'hoĭsʲ',\n",
" 'tsjɪ',\n",
" 'swɑːlywə',\n",
" 'tsiːs / tsjiːs',\n",
" 'moˑtər',\n",
" 'dɛĭ',\n",
" 'ioŋ',\n",
" 'jʊŋkjə',\n",
" 'bœ̝st',\n",
" 'briːf',\n",
" 'hɔĭtʲ',\n",
" 'spɔnə',\n",
" 'niˑjə',\n",
" 'kɑ̟rə',\n",
" 'sɪn',\n",
" 'koˑə̆nɪŋ',\n",
" 'eˑə̆k',\n",
" 'ʋɛn',\n",
" 'roˑə̆zən',\n",
" 'lɑ̟ŋə',\n",
" 'ʋɔĭtʲ',\n",
" 'bɔ̞nʲ',\n",
" 'ʋɑ̟z',\n",
" 'fɑ̟mkə / dɔxtərtsə',\n",
" 'bʊs',\n",
" 'leˑə̆rt',\n",
" 'mylə',\n",
" 'drux',\n",
" 'toˑə̆st',\n",
" 'ʋɛĭ',\n",
" '',\n",
" 'fɛsjə',\n",
" 'xuˑət',\n",
" 'kɛldər',\n",
" 'fŭɑ̟r',\n",
" 'mɔs',\n",
" 'ɔsəbluˑət̬',\n",
" 'drɪŋkə',\n",
" 'bruər',\n",
" 'muˑə̆t',\n",
" 'suˑp / kɑrnəmoˑə̆lək',\n",
" 'tɪn',\n",
" 'suːr',\n",
" 'pʏt',\n",
" 'uːr',\n",
" 'itɑ̟ːljə',\n",
" 'bɑ̟rɣən',\n",
" 'fjuːr',\n",
" 'spiˑə̆n',\n",
" 'drʏkən',\n",
" 'hɑ̟bə',\n",
" 'stɪk',\n",
" 'brʏx',\n",
" 'fɔlʲtsə',\n",
" 'kʊmə',\n",
" 'doˑə̆r',\n",
" 'nɑːĭjə',\n",
" 'xɛs',\n",
" 'brɔŭwər',\n",
" 'bɑ̟kə',\n",
" 'do̞',\n",
" 'ɑːə̆jən',\n",
" 'kriˑjə',\n",
" 'mɑ̟rək / mɑrəkt',\n",
" 'wɑːrə̃',\n",
" 'fiːf',\n",
" 'ɛikəls',\n",
" 'heˑə̆',\n",
" 'ɪz',\n",
" 'xriˑə̆n',\n",
" 'boːmkə',\n",
" 'ʋin',\n",
" 'hyːs',\n",
" 'mʊə̆lək',\n",
" 'spœĭt',\n",
" 'ku',\n",
" 'kɔstər',\n",
" 'krødʋɛin',\n",
" 'buːɣə',\n",
" 'dytsərs',\n",
" 'blɑːŭ',\n",
" 'slɛin',\n",
" 'sjy',\n",
" '',\n",
" 'sneː',\n",
" 'stɑ̟t',\n",
" 'dweˑə̆n',\n",
" 'doːpə',\n",
" 'doːpfʊnt',\n",
" 'sɔldɑːtən',\n",
" 'tɛskjə',\n",
" 'binə',\n",
" 'boŋ\\n']"
]
},
"execution_count": 4,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"table[1].split('\\t')"
]
}
],
"metadata": {
"kernelspec": {
"display_name": "Python 3",
"language": "python",
"name": "python3"
},
"language_info": {
"codemirror_mode": {
"name": "ipython",
"version": 3
},
"file_extension": ".py",
"mimetype": "text/x-python",
"name": "python",
"nbconvert_exporter": "python",
"pygments_lexer": "ipython3",
"version": "3.6.5"
}
},
"nbformat": 4,
"nbformat_minor": 2
}