stimmenfryslan/notebooks/Martijn Format.ipynb

431 lines
9.5 KiB
Plaintext
Raw Normal View History

2018-09-28 10:35:17 +02:00
{
"cells": [
{
"cell_type": "code",
"execution_count": 1,
"metadata": {},
"outputs": [],
"source": [
"with open('martijn_format/Dutch613-coordinates.txt') as f:\n",
" coordinates = list(f)\n",
" \n",
"with open('martijn_format/Nederlands-ipa.utxt') as f:\n",
" table = list(f)"
]
},
{
"cell_type": "code",
"execution_count": 9,
"metadata": {},
"outputs": [
{
"data": {
"text/plain": [
"['Aalsmeer NH', '4.76163', '52.2693\\n']"
]
},
"execution_count": 9,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"coordinates[1].split('\\t')"
]
},
{
"cell_type": "code",
"execution_count": 6,
"metadata": {},
"outputs": [
{
"data": {
"text/plain": [
"['',\n",
" 'kippen',\n",
" 'mijn',\n",
" 'vriend',\n",
" 'bloemen',\n",
" 'spinnen',\n",
" 'machines',\n",
" 'werk',\n",
" 'op',\n",
" 'schip',\n",
" 'kregen',\n",
" 'beschimmeld',\n",
" 'brood',\n",
" 'timmerman',\n",
" 'splinter',\n",
" 'vinger',\n",
" 'fabriek',\n",
" 'vier',\n",
" 'bier',\n",
" 'twee',\n",
" 'drie',\n",
" 'hij',\n",
" 'knuppel',\n",
" 'ik',\n",
" 'knie',\n",
" 'gezien',\n",
" 'ragebol',\n",
" 'pet',\n",
" 'paddestoel',\n",
" 'kerel',\n",
" 'brede',\n",
" 'stenen',\n",
" 'breder',\n",
" 'breedste',\n",
" 'standbeeld',\n",
" 'duivel',\n",
" 'gebleven',\n",
" 'meester',\n",
" 'zee',\n",
" 'graag',\n",
" 'keelpijn',\n",
" 'steel',\n",
" 'bezem',\n",
" 'neen',\n",
" 'geroepen',\n",
" 'peer',\n",
" 'rijp',\n",
" 'geld',\n",
" 'ver',\n",
" 'brengen',\n",
" 'vrouw',\n",
" 'zwemmen',\n",
" 'sterk',\n",
" 'bed',\n",
" 'optillen',\n",
" 'metselaar',\n",
" 'springen',\n",
" 'boterham',\n",
" 'vader',\n",
" 'zes',\n",
" 'jaar',\n",
" 'school',\n",
" 'laten',\n",
" 'gaan',\n",
" 'water',\n",
" 'potten',\n",
" 'zijn',\n",
" 'veel',\n",
" 'maart',\n",
" 'nog',\n",
" 'koud',\n",
" 'kaars',\n",
" 'geeft',\n",
" 'licht',\n",
" 'paard',\n",
" 'tegen',\n",
" 'zwaluwen',\n",
" 'kaas',\n",
" 'motor',\n",
" 'dag',\n",
" 'avond',\n",
" 'jongetje',\n",
" 'barst',\n",
" 'brief',\n",
" 'hart',\n",
" 'spannen',\n",
" 'nieuwe',\n",
" 'kar',\n",
" 'zoon',\n",
" 'koning',\n",
" 'ook',\n",
" 'geweest',\n",
" 'rozen',\n",
" 'lange',\n",
" 'woord',\n",
" 'kindje',\n",
" 'was',\n",
" 'dochtertje',\n",
" 'bos',\n",
" 'ladder',\n",
" 'mond',\n",
" 'droog',\n",
" 'dorst',\n",
" 'weg',\n",
" 'krom',\n",
" 'liedje',\n",
" 'goed',\n",
" 'kelder',\n",
" 'voor',\n",
" 'moest',\n",
" 'ossenbloed',\n",
" 'drinken',\n",
" 'broer',\n",
" 'moe',\n",
" 'karnemelk',\n",
" 'dun',\n",
" 'zuur',\n",
" 'put',\n",
" 'uur',\n",
" 'Italië',\n",
" 'bergen',\n",
" 'vuur',\n",
" 'spuwen',\n",
" 'duwen',\n",
" 'hebben',\n",
" 'stuk',\n",
" 'brug',\n",
" 'veulen',\n",
" 'komen',\n",
" 'deur',\n",
" 'naaien',\n",
" 'gras',\n",
" 'brouwer',\n",
" 'bakken',\n",
" 'je',\n",
" 'eieren',\n",
" 'krijgen',\n",
" 'markt',\n",
" 'waren',\n",
" 'vijf',\n",
" 'eikels',\n",
" 'hooi',\n",
" 'is',\n",
" 'groen',\n",
" 'boompje',\n",
" 'wijn',\n",
" 'huis',\n",
" 'melk',\n",
" 'spuit',\n",
" 'koe',\n",
" 'koster',\n",
" 'kruiwagen',\n",
" 'buigen',\n",
" 'Duitsers',\n",
" 'blauw',\n",
" 'geslagen',\n",
" 'saus',\n",
" 'flauw',\n",
" 'sneeuw',\n",
" 'stad',\n",
" 'doen',\n",
" 'dopen',\n",
" 'doopvont',\n",
" 'soldaten',\n",
" 'dorsen',\n",
" 'binden',\n",
" 'gebonden\\n']"
]
},
"execution_count": 6,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"table[0].split('\\t')"
]
},
{
"cell_type": "code",
"execution_count": 4,
"metadata": {},
"outputs": [
{
"data": {
"text/plain": [
"['West-Terschelling',\n",
" 'kipən',\n",
" 'miŋ',\n",
" 'kɑ̟mərɑ̟ːt',\n",
" 'blʊmə',\n",
" 'spɪnə',\n",
" 'məsinəs / məʃinəs',\n",
" 'ʋɔrə̆k',\n",
" 'ʊp̬',\n",
" 'sxɪp',\n",
" 'kreːɣə̃ / krɪɣə̃',\n",
" 'fəsxɪməlt / bəsxɪməlt',\n",
" 'bro̝ˑə̆t',\n",
" 'tɪmərmɑn',\n",
" 'splɪntər',\n",
" 'fɪŋər',\n",
" 'fəbrik',\n",
" 'fjɔŭwər',\n",
" 'biˑə̆r',\n",
" 'twɑ̟',\n",
" 'treːĭjə',\n",
" 'hɛĭ',\n",
" 'knʏpəl / ɛinhɔŭt',\n",
" 'ɪk',\n",
" 'knɪbəl',\n",
" 'siˑə̆n',\n",
" 'rɑ̟ːɣəbɔl',\n",
" 'pɛt',\n",
" 'pɑ̟dəstuˑə̆l',\n",
" 'mɑ̟n',\n",
" 'breːdə / breːjə',\n",
" 'stɪː',\n",
" 'breːdər',\n",
" 'breːstə',\n",
" 'stɔndbeːlt',\n",
" 'dyvəl',\n",
" 'blɔŭn',\n",
" 'meːstər',\n",
" 'seˑ',\n",
" 'xrɑːx',\n",
" 'ətĩˑsĩkeːl',\n",
" 'stɛːl',\n",
" 'biːzəm',\n",
" 'neː',\n",
" 'rɔft',\n",
" 'pɔˑə̆r',\n",
" 'rip',\n",
" 'jɪlt',\n",
" 'fiˑə̆r',\n",
" 'brɪŋə',\n",
" 'ʋiːf',\n",
" 'swʊmə',\n",
" 'stɛrk',\n",
" 'bɛˑə̆t',\n",
" 'ʊptɪlən',\n",
" '',\n",
" 'sprɪŋə',\n",
" '',\n",
" 'tɔ̞ˑə̆',\n",
" 'sɛks',\n",
" 'jiə̆r',\n",
" 'sxuˑəl',\n",
" 'lɪtn̩̆',\n",
" 'xeˑə̆̃',\n",
" 'ʋɛtər',\n",
" 'pɔtn̩̆',\n",
" 'bɪn',\n",
" 'fʊlə',\n",
" 'mɑˑə̆t',\n",
" 'nɔx',\n",
" 'kɔˑə̆t',\n",
" 'kɛs',\n",
" 'jʊxt',\n",
" 'jɛxt',\n",
" 'hoĭsʲ',\n",
" 'tsjɪ',\n",
" 'swɑːlywə',\n",
" 'tsiːs / tsjiːs',\n",
" 'moˑtər',\n",
" 'dɛĭ',\n",
" 'ioŋ',\n",
" 'jʊŋkjə',\n",
" 'bœ̝st',\n",
" 'briːf',\n",
" 'hɔĭtʲ',\n",
" 'spɔnə',\n",
" 'niˑjə',\n",
" 'kɑ̟rə',\n",
" 'sɪn',\n",
" 'koˑə̆nɪŋ',\n",
" 'eˑə̆k',\n",
" 'ʋɛn',\n",
" 'roˑə̆zən',\n",
" 'lɑ̟ŋə',\n",
" 'ʋɔĭtʲ',\n",
" 'bɔ̞nʲ',\n",
" 'ʋɑ̟z',\n",
" 'fɑ̟mkə / dɔxtərtsə',\n",
" 'bʊs',\n",
" 'leˑə̆rt',\n",
" 'mylə',\n",
" 'drux',\n",
" 'toˑə̆st',\n",
" 'ʋɛĭ',\n",
" '',\n",
" 'fɛsjə',\n",
" 'xuˑət',\n",
" 'kɛldər',\n",
" 'fŭɑ̟r',\n",
" 'mɔs',\n",
" 'ɔsəbluˑət̬',\n",
" 'drɪŋkə',\n",
" 'bruər',\n",
" 'muˑə̆t',\n",
" 'suˑp / kɑrnəmoˑə̆lək',\n",
" 'tɪn',\n",
" 'suːr',\n",
" 'pʏt',\n",
" 'uːr',\n",
" 'itɑ̟ːljə',\n",
" 'bɑ̟rɣən',\n",
" 'fjuːr',\n",
" 'spiˑə̆n',\n",
" 'drʏkən',\n",
" 'hɑ̟bə',\n",
" 'stɪk',\n",
" 'brʏx',\n",
" 'fɔlʲtsə',\n",
" 'kʊmə',\n",
" 'doˑə̆r',\n",
" 'nɑːĭjə',\n",
" 'xɛs',\n",
" 'brɔŭwər',\n",
" 'bɑ̟kə',\n",
" 'do̞',\n",
" 'ɑːə̆jən',\n",
" 'kriˑjə',\n",
" 'mɑ̟rək / mɑrəkt',\n",
" 'wɑːrə̃',\n",
" 'fiːf',\n",
" 'ɛikəls',\n",
" 'heˑə̆',\n",
" 'ɪz',\n",
" 'xriˑə̆n',\n",
" 'boːmkə',\n",
" 'ʋin',\n",
" 'hyːs',\n",
" 'mʊə̆lək',\n",
" 'spœĭt',\n",
" 'ku',\n",
" 'kɔstər',\n",
" 'krødʋɛin',\n",
" 'buːɣə',\n",
" 'dytsərs',\n",
" 'blɑːŭ',\n",
" 'slɛin',\n",
" 'sjy',\n",
" '',\n",
" 'sneː',\n",
" 'stɑ̟t',\n",
" 'dweˑə̆n',\n",
" 'doːpə',\n",
" 'doːpfʊnt',\n",
" 'sɔldɑːtən',\n",
" 'tɛskjə',\n",
" 'binə',\n",
" 'boŋ\\n']"
]
},
"execution_count": 4,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"table[1].split('\\t')"
]
}
],
"metadata": {
"kernelspec": {
"display_name": "Python 3",
"language": "python",
"name": "python3"
},
"language_info": {
"codemirror_mode": {
"name": "ipython",
"version": 3
},
"file_extension": ".py",
"mimetype": "text/x-python",
"name": "python",
"nbconvert_exporter": "python",
"pygments_lexer": "ipython3",
"version": "3.6.5"
}
},
"nbformat": 4,
"nbformat_minor": 2
}