*/txt2corpus.sh : alto -q
This commit is contained in:
@@ -57,7 +57,7 @@ Alpino -flag treebank xml debug=1 end_hook=xml user_max=900000 -parse < $corpus.
|
|||||||
|
|
||||||
cd xml
|
cd xml
|
||||||
rm -f $corpus.data.dz $corpus.index
|
rm -f $corpus.data.dz $corpus.index
|
||||||
alto -o $corpus.data.dz *.xml 2> /dev/null
|
alto -q -o $corpus.data.dz *.xml
|
||||||
|
|
||||||
cd ../..
|
cd ../..
|
||||||
rm -fr out
|
rm -fr out
|
||||||
|
|||||||
@@ -55,7 +55,7 @@ Alpino -flag treebank xml debug=1 end_hook=xml user_max=900000 -parse < $corpus.
|
|||||||
|
|
||||||
cd xml
|
cd xml
|
||||||
rm -f $corpus.data.dz $corpus.index
|
rm -f $corpus.data.dz $corpus.index
|
||||||
alto -o $corpus.data.dz *.xml 2> /dev/null
|
alto -q -o $corpus.data.dz *.xml
|
||||||
|
|
||||||
cd ../..
|
cd ../..
|
||||||
rm -fr out
|
rm -fr out
|
||||||
|
|||||||
@@ -57,7 +57,7 @@ Alpino -flag treebank xml debug=1 end_hook=xml user_max=900000 -parse < $corpus.
|
|||||||
|
|
||||||
cd xml
|
cd xml
|
||||||
rm -f $corpus.data.dz $corpus.index
|
rm -f $corpus.data.dz $corpus.index
|
||||||
alto -o $corpus.data.dz *.xml 2> /dev/null
|
alto -q -o $corpus.data.dz *.xml
|
||||||
|
|
||||||
# telling per bericht, niet per zin
|
# telling per bericht, niet per zin
|
||||||
/net/corpora/nlnieuws/namen.sh -x C -s $corpus.data.dz > $corpus.cat.txt
|
/net/corpora/nlnieuws/namen.sh -x C -s $corpus.data.dz > $corpus.cat.txt
|
||||||
|
|||||||
@@ -55,7 +55,7 @@ Alpino -flag treebank xml debug=1 end_hook=xml user_max=900000 -parse < $corpus.
|
|||||||
|
|
||||||
cd xml
|
cd xml
|
||||||
rm -f $corpus.data.dz $corpus.index
|
rm -f $corpus.data.dz $corpus.index
|
||||||
alto -o $corpus.data.dz *.xml 2> /dev/null
|
alto -q -o $corpus.data.dz *.xml
|
||||||
|
|
||||||
# telling per bericht, niet per zin
|
# telling per bericht, niet per zin
|
||||||
/net/corpora/nlnieuws/namen.sh -x T -s $corpus.data.dz > $corpus.tag.txt
|
/net/corpora/nlnieuws/namen.sh -x T -s $corpus.data.dz > $corpus.tag.txt
|
||||||
|
|||||||
@@ -57,7 +57,7 @@ Alpino -flag treebank xml debug=1 end_hook=xml user_max=900000 -parse < $corpus.
|
|||||||
|
|
||||||
cd xml
|
cd xml
|
||||||
rm -f $corpus.data.dz $corpus.index
|
rm -f $corpus.data.dz $corpus.index
|
||||||
alto -o $corpus.data.dz *.xml 2> /dev/null
|
alto -q -o $corpus.data.dz *.xml
|
||||||
|
|
||||||
# telling per bericht, niet per zin
|
# telling per bericht, niet per zin
|
||||||
/net/corpora/nlnieuws/namen.sh -x T -s $corpus.data.dz > $corpus.tag.txt
|
/net/corpora/nlnieuws/namen.sh -x T -s $corpus.data.dz > $corpus.tag.txt
|
||||||
|
|||||||
@@ -57,7 +57,7 @@ Alpino -flag treebank xml debug=1 end_hook=xml user_max=900000 -parse < $corpus.
|
|||||||
|
|
||||||
cd xml
|
cd xml
|
||||||
rm -f $corpus.data.dz $corpus.index
|
rm -f $corpus.data.dz $corpus.index
|
||||||
alto -o $corpus.data.dz *.xml 2> /dev/null
|
alto -q -o $corpus.data.dz *.xml
|
||||||
|
|
||||||
# telling per bericht, niet per zin
|
# telling per bericht, niet per zin
|
||||||
/net/corpora/nlnieuws/namen.sh -x T -s $corpus.data.dz > $corpus.tag.txt
|
/net/corpora/nlnieuws/namen.sh -x T -s $corpus.data.dz > $corpus.tag.txt
|
||||||
|
|||||||
@@ -57,7 +57,7 @@ Alpino -flag treebank xml debug=1 end_hook=xml user_max=900000 -parse < $corpus.
|
|||||||
|
|
||||||
cd xml
|
cd xml
|
||||||
rm -f $corpus.data.dz $corpus.index
|
rm -f $corpus.data.dz $corpus.index
|
||||||
alto -o $corpus.data.dz *.xml 2> /dev/null
|
alto -q -o $corpus.data.dz *.xml
|
||||||
|
|
||||||
# telling per bericht, niet per zin
|
# telling per bericht, niet per zin
|
||||||
/net/corpora/nlnieuws/namen.sh -x T -s $corpus.data.dz > $corpus.tag.txt
|
/net/corpora/nlnieuws/namen.sh -x T -s $corpus.data.dz > $corpus.tag.txt
|
||||||
|
|||||||
@@ -55,7 +55,7 @@ Alpino -flag treebank xml debug=1 end_hook=xml user_max=900000 -parse < $corpus.
|
|||||||
|
|
||||||
cd xml
|
cd xml
|
||||||
rm -f $corpus.data.dz $corpus.index
|
rm -f $corpus.data.dz $corpus.index
|
||||||
alto -o $corpus.data.dz *.xml 2> /dev/null
|
alto -q -o $corpus.data.dz *.xml
|
||||||
|
|
||||||
# telling per bericht, niet per zin
|
# telling per bericht, niet per zin
|
||||||
/net/corpora/nlnieuws/namen.sh -x C -s $corpus.data.dz > $corpus.cat.txt
|
/net/corpora/nlnieuws/namen.sh -x C -s $corpus.data.dz > $corpus.cat.txt
|
||||||
|
|||||||
@@ -57,7 +57,7 @@ Alpino -flag treebank xml debug=1 end_hook=xml user_max=900000 -parse < $corpus.
|
|||||||
|
|
||||||
cd xml
|
cd xml
|
||||||
rm -f $corpus.data.dz $corpus.index
|
rm -f $corpus.data.dz $corpus.index
|
||||||
alto -o $corpus.data.dz *.xml 2> /dev/null
|
alto -q -o $corpus.data.dz *.xml
|
||||||
|
|
||||||
# telling per bericht, niet per zin
|
# telling per bericht, niet per zin
|
||||||
/net/corpora/nlnieuws/namen.sh -x T -s $corpus.data.dz > $corpus.tag.txt
|
/net/corpora/nlnieuws/namen.sh -x T -s $corpus.data.dz > $corpus.tag.txt
|
||||||
|
|||||||
@@ -55,7 +55,7 @@ Alpino -flag treebank xml debug=1 end_hook=xml user_max=900000 -parse < $corpus.
|
|||||||
|
|
||||||
cd xml
|
cd xml
|
||||||
rm -f $corpus.data.dz $corpus.index
|
rm -f $corpus.data.dz $corpus.index
|
||||||
alto -o $corpus.data.dz *.xml 2> /dev/null
|
alto -q -o $corpus.data.dz *.xml
|
||||||
|
|
||||||
cd ../..
|
cd ../..
|
||||||
rm -fr out
|
rm -fr out
|
||||||
|
|||||||
@@ -57,7 +57,7 @@ Alpino -flag treebank xml debug=1 end_hook=xml user_max=900000 -parse < $corpus.
|
|||||||
|
|
||||||
cd xml
|
cd xml
|
||||||
rm -f $corpus.data.dz $corpus.index
|
rm -f $corpus.data.dz $corpus.index
|
||||||
alto -o $corpus.data.dz *.xml 2> /dev/null
|
alto -q -o $corpus.data.dz *.xml
|
||||||
|
|
||||||
# telling per bericht, niet per zin
|
# telling per bericht, niet per zin
|
||||||
/net/corpora/nlnieuws/namen.sh -x T -s $corpus.data.dz > $corpus.tag.txt
|
/net/corpora/nlnieuws/namen.sh -x T -s $corpus.data.dz > $corpus.tag.txt
|
||||||
|
|||||||
@@ -55,7 +55,7 @@ Alpino -flag treebank xml debug=1 end_hook=xml user_max=900000 -parse < $corpus.
|
|||||||
|
|
||||||
cd xml
|
cd xml
|
||||||
rm -f $corpus.data.dz $corpus.index
|
rm -f $corpus.data.dz $corpus.index
|
||||||
alto -o $corpus.data.dz *.xml 2> /dev/null
|
alto -q -o $corpus.data.dz *.xml
|
||||||
|
|
||||||
# telling per bericht, niet per zin
|
# telling per bericht, niet per zin
|
||||||
/net/corpora/nlnieuws/namen.sh -x C -s $corpus.data.dz > $corpus.cat.txt
|
/net/corpora/nlnieuws/namen.sh -x C -s $corpus.data.dz > $corpus.cat.txt
|
||||||
|
|||||||
Reference in New Issue
Block a user