*/txt2corpus.sh : alto -q

This commit is contained in:
Peter Kleiweg
2026-04-16 14:28:05 +02:00
parent 84fd44f267
commit 08c8d57107
12 changed files with 12 additions and 12 deletions

View File

@@ -57,7 +57,7 @@ Alpino -flag treebank xml debug=1 end_hook=xml user_max=900000 -parse < $corpus.
cd xml
rm -f $corpus.data.dz $corpus.index
alto -o $corpus.data.dz *.xml 2> /dev/null
alto -q -o $corpus.data.dz *.xml
cd ../..
rm -fr out

View File

@@ -55,7 +55,7 @@ Alpino -flag treebank xml debug=1 end_hook=xml user_max=900000 -parse < $corpus.
cd xml
rm -f $corpus.data.dz $corpus.index
alto -o $corpus.data.dz *.xml 2> /dev/null
alto -q -o $corpus.data.dz *.xml
cd ../..
rm -fr out

View File

@@ -57,7 +57,7 @@ Alpino -flag treebank xml debug=1 end_hook=xml user_max=900000 -parse < $corpus.
cd xml
rm -f $corpus.data.dz $corpus.index
alto -o $corpus.data.dz *.xml 2> /dev/null
alto -q -o $corpus.data.dz *.xml
# telling per bericht, niet per zin
/net/corpora/nlnieuws/namen.sh -x C -s $corpus.data.dz > $corpus.cat.txt

View File

@@ -55,7 +55,7 @@ Alpino -flag treebank xml debug=1 end_hook=xml user_max=900000 -parse < $corpus.
cd xml
rm -f $corpus.data.dz $corpus.index
alto -o $corpus.data.dz *.xml 2> /dev/null
alto -q -o $corpus.data.dz *.xml
# telling per bericht, niet per zin
/net/corpora/nlnieuws/namen.sh -x T -s $corpus.data.dz > $corpus.tag.txt

View File

@@ -57,7 +57,7 @@ Alpino -flag treebank xml debug=1 end_hook=xml user_max=900000 -parse < $corpus.
cd xml
rm -f $corpus.data.dz $corpus.index
alto -o $corpus.data.dz *.xml 2> /dev/null
alto -q -o $corpus.data.dz *.xml
# telling per bericht, niet per zin
/net/corpora/nlnieuws/namen.sh -x T -s $corpus.data.dz > $corpus.tag.txt

View File

@@ -57,7 +57,7 @@ Alpino -flag treebank xml debug=1 end_hook=xml user_max=900000 -parse < $corpus.
cd xml
rm -f $corpus.data.dz $corpus.index
alto -o $corpus.data.dz *.xml 2> /dev/null
alto -q -o $corpus.data.dz *.xml
# telling per bericht, niet per zin
/net/corpora/nlnieuws/namen.sh -x T -s $corpus.data.dz > $corpus.tag.txt

View File

@@ -57,7 +57,7 @@ Alpino -flag treebank xml debug=1 end_hook=xml user_max=900000 -parse < $corpus.
cd xml
rm -f $corpus.data.dz $corpus.index
alto -o $corpus.data.dz *.xml 2> /dev/null
alto -q -o $corpus.data.dz *.xml
# telling per bericht, niet per zin
/net/corpora/nlnieuws/namen.sh -x T -s $corpus.data.dz > $corpus.tag.txt

View File

@@ -55,7 +55,7 @@ Alpino -flag treebank xml debug=1 end_hook=xml user_max=900000 -parse < $corpus.
cd xml
rm -f $corpus.data.dz $corpus.index
alto -o $corpus.data.dz *.xml 2> /dev/null
alto -q -o $corpus.data.dz *.xml
# telling per bericht, niet per zin
/net/corpora/nlnieuws/namen.sh -x C -s $corpus.data.dz > $corpus.cat.txt

View File

@@ -57,7 +57,7 @@ Alpino -flag treebank xml debug=1 end_hook=xml user_max=900000 -parse < $corpus.
cd xml
rm -f $corpus.data.dz $corpus.index
alto -o $corpus.data.dz *.xml 2> /dev/null
alto -q -o $corpus.data.dz *.xml
# telling per bericht, niet per zin
/net/corpora/nlnieuws/namen.sh -x T -s $corpus.data.dz > $corpus.tag.txt

View File

@@ -55,7 +55,7 @@ Alpino -flag treebank xml debug=1 end_hook=xml user_max=900000 -parse < $corpus.
cd xml
rm -f $corpus.data.dz $corpus.index
alto -o $corpus.data.dz *.xml 2> /dev/null
alto -q -o $corpus.data.dz *.xml
cd ../..
rm -fr out

View File

@@ -57,7 +57,7 @@ Alpino -flag treebank xml debug=1 end_hook=xml user_max=900000 -parse < $corpus.
cd xml
rm -f $corpus.data.dz $corpus.index
alto -o $corpus.data.dz *.xml 2> /dev/null
alto -q -o $corpus.data.dz *.xml
# telling per bericht, niet per zin
/net/corpora/nlnieuws/namen.sh -x T -s $corpus.data.dz > $corpus.tag.txt

View File

@@ -55,7 +55,7 @@ Alpino -flag treebank xml debug=1 end_hook=xml user_max=900000 -parse < $corpus.
cd xml
rm -f $corpus.data.dz $corpus.index
alto -o $corpus.data.dz *.xml 2> /dev/null
alto -q -o $corpus.data.dz *.xml
# telling per bericht, niet per zin
/net/corpora/nlnieuws/namen.sh -x C -s $corpus.data.dz > $corpus.cat.txt