{ "cells": [ { "cell_type": "code", "execution_count": 1, "metadata": {}, "outputs": [], "source": [ "with open('martijn_format/Dutch613-coordinates.txt') as f:\n", " coordinates = list(f)\n", " \n", "with open('martijn_format/Nederlands-ipa.utxt') as f:\n", " table = list(f)" ] }, { "cell_type": "code", "execution_count": 9, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "['Aalsmeer NH', '4.76163', '52.2693\\n']" ] }, "execution_count": 9, "metadata": {}, "output_type": "execute_result" } ], "source": [ "coordinates[1].split('\\t')" ] }, { "cell_type": "code", "execution_count": 6, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "['',\n", " 'kippen',\n", " 'mijn',\n", " 'vriend',\n", " 'bloemen',\n", " 'spinnen',\n", " 'machines',\n", " 'werk',\n", " 'op',\n", " 'schip',\n", " 'kregen',\n", " 'beschimmeld',\n", " 'brood',\n", " 'timmerman',\n", " 'splinter',\n", " 'vinger',\n", " 'fabriek',\n", " 'vier',\n", " 'bier',\n", " 'twee',\n", " 'drie',\n", " 'hij',\n", " 'knuppel',\n", " 'ik',\n", " 'knie',\n", " 'gezien',\n", " 'ragebol',\n", " 'pet',\n", " 'paddestoel',\n", " 'kerel',\n", " 'brede',\n", " 'stenen',\n", " 'breder',\n", " 'breedste',\n", " 'standbeeld',\n", " 'duivel',\n", " 'gebleven',\n", " 'meester',\n", " 'zee',\n", " 'graag',\n", " 'keelpijn',\n", " 'steel',\n", " 'bezem',\n", " 'neen',\n", " 'geroepen',\n", " 'peer',\n", " 'rijp',\n", " 'geld',\n", " 'ver',\n", " 'brengen',\n", " 'vrouw',\n", " 'zwemmen',\n", " 'sterk',\n", " 'bed',\n", " 'optillen',\n", " 'metselaar',\n", " 'springen',\n", " 'boterham',\n", " 'vader',\n", " 'zes',\n", " 'jaar',\n", " 'school',\n", " 'laten',\n", " 'gaan',\n", " 'water',\n", " 'potten',\n", " 'zijn',\n", " 'veel',\n", " 'maart',\n", " 'nog',\n", " 'koud',\n", " 'kaars',\n", " 'geeft',\n", " 'licht',\n", " 'paard',\n", " 'tegen',\n", " 'zwaluwen',\n", " 'kaas',\n", " 'motor',\n", " 'dag',\n", " 'avond',\n", " 'jongetje',\n", " 'barst',\n", " 'brief',\n", " 'hart',\n", " 'spannen',\n", " 'nieuwe',\n", " 'kar',\n", " 'zoon',\n", " 'koning',\n", " 'ook',\n", " 'geweest',\n", " 'rozen',\n", " 'lange',\n", " 'woord',\n", " 'kindje',\n", " 'was',\n", " 'dochtertje',\n", " 'bos',\n", " 'ladder',\n", " 'mond',\n", " 'droog',\n", " 'dorst',\n", " 'weg',\n", " 'krom',\n", " 'liedje',\n", " 'goed',\n", " 'kelder',\n", " 'voor',\n", " 'moest',\n", " 'ossenbloed',\n", " 'drinken',\n", " 'broer',\n", " 'moe',\n", " 'karnemelk',\n", " 'dun',\n", " 'zuur',\n", " 'put',\n", " 'uur',\n", " 'Italië',\n", " 'bergen',\n", " 'vuur',\n", " 'spuwen',\n", " 'duwen',\n", " 'hebben',\n", " 'stuk',\n", " 'brug',\n", " 'veulen',\n", " 'komen',\n", " 'deur',\n", " 'naaien',\n", " 'gras',\n", " 'brouwer',\n", " 'bakken',\n", " 'je',\n", " 'eieren',\n", " 'krijgen',\n", " 'markt',\n", " 'waren',\n", " 'vijf',\n", " 'eikels',\n", " 'hooi',\n", " 'is',\n", " 'groen',\n", " 'boompje',\n", " 'wijn',\n", " 'huis',\n", " 'melk',\n", " 'spuit',\n", " 'koe',\n", " 'koster',\n", " 'kruiwagen',\n", " 'buigen',\n", " 'Duitsers',\n", " 'blauw',\n", " 'geslagen',\n", " 'saus',\n", " 'flauw',\n", " 'sneeuw',\n", " 'stad',\n", " 'doen',\n", " 'dopen',\n", " 'doopvont',\n", " 'soldaten',\n", " 'dorsen',\n", " 'binden',\n", " 'gebonden\\n']" ] }, "execution_count": 6, "metadata": {}, "output_type": "execute_result" } ], "source": [ "table[0].split('\\t')" ] }, { "cell_type": "code", "execution_count": 4, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "['West-Terschelling',\n", " 'kipən',\n", " 'miŋ',\n", " 'kɑ̟mərɑ̟ːt',\n", " 'blʊmə',\n", " 'spɪnə',\n", " 'məsinəs / məʃinəs',\n", " 'ʋɔrə̆k',\n", " 'ʊp̬',\n", " 'sxɪp',\n", " 'kreːɣə̃ / krɪɣə̃',\n", " 'fəsxɪməlt / bəsxɪməlt',\n", " 'bro̝ˑə̆t',\n", " 'tɪmərmɑn',\n", " 'splɪntər',\n", " 'fɪŋər',\n", " 'fəbrik',\n", " 'fjɔŭwər',\n", " 'biˑə̆r',\n", " 'twɑ̟',\n", " 'treːĭjə',\n", " 'hɛĭ',\n", " 'knʏpəl / ɛinhɔŭt',\n", " 'ɪk',\n", " 'knɪbəl',\n", " 'siˑə̆n',\n", " 'rɑ̟ːɣəbɔl',\n", " 'pɛt',\n", " 'pɑ̟dəstuˑə̆l',\n", " 'mɑ̟n',\n", " 'breːdə / breːjə',\n", " 'stɪn̩ː',\n", " 'breːdər',\n", " 'breːstə',\n", " 'stɔndbeːlt',\n", " 'dyvəl',\n", " 'blɔŭn',\n", " 'meːstər',\n", " 'seˑ',\n", " 'xrɑːx',\n", " 'ətĩˑsĩkeːl',\n", " 'stɛːl',\n", " 'biːzəm',\n", " 'neː',\n", " 'rɔft',\n", " 'pɔˑə̆r',\n", " 'rip',\n", " 'jɪlt',\n", " 'fiˑə̆r',\n", " 'brɪŋə',\n", " 'ʋiːf',\n", " 'swʊmə',\n", " 'stɛrk',\n", " 'bɛˑə̆t',\n", " 'ʊptɪlən',\n", " '',\n", " 'sprɪŋə',\n", " '',\n", " 'tɔ̞ˑə̆',\n", " 'sɛks',\n", " 'jiə̆r',\n", " 'sxuˑəl',\n", " 'lɪtn̩̆',\n", " 'xeˑə̆̃',\n", " 'ʋɛtər',\n", " 'pɔtn̩̆',\n", " 'bɪn',\n", " 'fʊlə',\n", " 'mɑˑə̆t',\n", " 'nɔx',\n", " 'kɔˑə̆t',\n", " 'kɛs',\n", " 'jʊxt',\n", " 'jɛxt',\n", " 'hoĭsʲ',\n", " 'tsjɪ',\n", " 'swɑːlywə',\n", " 'tsiːs / tsjiːs',\n", " 'moˑtər',\n", " 'dɛĭ',\n", " 'ioŋ',\n", " 'jʊŋkjə',\n", " 'bœ̝st',\n", " 'briːf',\n", " 'hɔĭtʲ',\n", " 'spɔnə',\n", " 'niˑjə',\n", " 'kɑ̟rə',\n", " 'sɪn',\n", " 'koˑə̆nɪŋ',\n", " 'eˑə̆k',\n", " 'ʋɛn',\n", " 'roˑə̆zən',\n", " 'lɑ̟ŋə',\n", " 'ʋɔĭtʲ',\n", " 'bɔ̞nʲ',\n", " 'ʋɑ̟z',\n", " 'fɑ̟mkə / dɔxtərtsə',\n", " 'bʊs',\n", " 'leˑə̆rt',\n", " 'mylə',\n", " 'drux',\n", " 'toˑə̆st',\n", " 'ʋɛĭ',\n", " '',\n", " 'fɛsjə',\n", " 'xuˑət',\n", " 'kɛldər',\n", " 'fŭɑ̟r',\n", " 'mɔs',\n", " 'ɔsəbluˑət̬',\n", " 'drɪŋkə',\n", " 'bruər',\n", " 'muˑə̆t',\n", " 'suˑp / kɑrnəmoˑə̆lək',\n", " 'tɪn',\n", " 'suːr',\n", " 'pʏt',\n", " 'uːr',\n", " 'itɑ̟ːljə',\n", " 'bɑ̟rɣən',\n", " 'fjuːr',\n", " 'spiˑə̆n',\n", " 'drʏkən',\n", " 'hɑ̟bə',\n", " 'stɪk',\n", " 'brʏx',\n", " 'fɔlʲtsə',\n", " 'kʊmə',\n", " 'doˑə̆r',\n", " 'nɑːĭjə',\n", " 'xɛs',\n", " 'brɔŭwər',\n", " 'bɑ̟kə',\n", " 'do̞',\n", " 'ɑːə̆jən',\n", " 'kriˑjə',\n", " 'mɑ̟rək / mɑrəkt',\n", " 'wɑːrə̃',\n", " 'fiːf',\n", " 'ɛikəls',\n", " 'heˑə̆',\n", " 'ɪz',\n", " 'xriˑə̆n',\n", " 'boːmkə',\n", " 'ʋin',\n", " 'hyːs',\n", " 'mʊə̆lək',\n", " 'spœĭt',\n", " 'ku',\n", " 'kɔstər',\n", " 'krødʋɛin',\n", " 'buːɣə',\n", " 'dytsərs',\n", " 'blɑːŭ',\n", " 'slɛin',\n", " 'sjy',\n", " '',\n", " 'sneː',\n", " 'stɑ̟t',\n", " 'dweˑə̆n',\n", " 'doːpə',\n", " 'doːpfʊnt',\n", " 'sɔldɑːtən',\n", " 'tɛskjə',\n", " 'binə',\n", " 'boŋ\\n']" ] }, "execution_count": 4, "metadata": {}, "output_type": "execute_result" } ], "source": [ "table[1].split('\\t')" ] } ], "metadata": { "kernelspec": { "display_name": "Python 3", "language": "python", "name": "python3" }, "language_info": { "codemirror_mode": { "name": "ipython", "version": 3 }, "file_extension": ".py", "mimetype": "text/x-python", "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", "version": "3.6.5" } }, "nbformat": 4, "nbformat_minor": 2 }