9,10 -> C,T
This commit is contained in:
@@ -59,8 +59,8 @@ cd xml
|
|||||||
alto -o $corpus.data.dz *.xml 2> /dev/null
|
alto -o $corpus.data.dz *.xml 2> /dev/null
|
||||||
|
|
||||||
# telling per bericht, niet per zin
|
# telling per bericht, niet per zin
|
||||||
/net/corpora/nlnieuws/namen.sh -x 9 -s $corpus.data.dz > $corpus.cat.txt
|
/net/corpora/nlnieuws/namen.sh -x C -s $corpus.data.dz > $corpus.cat.txt
|
||||||
/net/corpora/nlnieuws/namen.sh -x 10 -s $corpus.data.dz > $corpus.tag.txt
|
/net/corpora/nlnieuws/namen.sh -x T -s $corpus.data.dz > $corpus.tag.txt
|
||||||
|
|
||||||
cd ../..
|
cd ../..
|
||||||
rm -fr out
|
rm -fr out
|
||||||
|
|||||||
@@ -57,7 +57,7 @@ cd xml
|
|||||||
alto -o $corpus.data.dz *.xml 2> /dev/null
|
alto -o $corpus.data.dz *.xml 2> /dev/null
|
||||||
|
|
||||||
# telling per bericht, niet per zin
|
# telling per bericht, niet per zin
|
||||||
/net/corpora/nlnieuws/namen.sh -x 10 -s $corpus.data.dz > $corpus.tag.txt
|
/net/corpora/nlnieuws/namen.sh -x T -s $corpus.data.dz > $corpus.tag.txt
|
||||||
|
|
||||||
cd ../..
|
cd ../..
|
||||||
rm -fr out
|
rm -fr out
|
||||||
|
|||||||
@@ -59,7 +59,7 @@ cd xml
|
|||||||
alto -o $corpus.data.dz *.xml 2> /dev/null
|
alto -o $corpus.data.dz *.xml 2> /dev/null
|
||||||
|
|
||||||
# telling per bericht, niet per zin
|
# telling per bericht, niet per zin
|
||||||
/net/corpora/nlnieuws/namen.sh -x 10 -s $corpus.data.dz > $corpus.tag.txt
|
/net/corpora/nlnieuws/namen.sh -x T -s $corpus.data.dz > $corpus.tag.txt
|
||||||
|
|
||||||
cd ../..
|
cd ../..
|
||||||
rm -fr out
|
rm -fr out
|
||||||
|
|||||||
@@ -59,7 +59,7 @@ cd xml
|
|||||||
alto -o $corpus.data.dz *.xml 2> /dev/null
|
alto -o $corpus.data.dz *.xml 2> /dev/null
|
||||||
|
|
||||||
# telling per bericht, niet per zin
|
# telling per bericht, niet per zin
|
||||||
/net/corpora/nlnieuws/namen.sh -x 10 -s $corpus.data.dz > $corpus.tag.txt
|
/net/corpora/nlnieuws/namen.sh -x T -s $corpus.data.dz > $corpus.tag.txt
|
||||||
|
|
||||||
cd ../..
|
cd ../..
|
||||||
rm -fr out
|
rm -fr out
|
||||||
|
|||||||
@@ -59,7 +59,7 @@ cd xml
|
|||||||
alto -o $corpus.data.dz *.xml 2> /dev/null
|
alto -o $corpus.data.dz *.xml 2> /dev/null
|
||||||
|
|
||||||
# telling per bericht, niet per zin
|
# telling per bericht, niet per zin
|
||||||
/net/corpora/nlnieuws/namen.sh -x 10 -s $corpus.data.dz > $corpus.tag.txt
|
/net/corpora/nlnieuws/namen.sh -x T -s $corpus.data.dz > $corpus.tag.txt
|
||||||
|
|
||||||
cd ../..
|
cd ../..
|
||||||
rm -fr out
|
rm -fr out
|
||||||
|
|||||||
@@ -59,7 +59,7 @@ cd xml
|
|||||||
alto -o $corpus.data.dz *.xml 2> /dev/null
|
alto -o $corpus.data.dz *.xml 2> /dev/null
|
||||||
|
|
||||||
# telling per bericht, niet per zin
|
# telling per bericht, niet per zin
|
||||||
/net/corpora/nlnieuws/namen.sh -x 10 -s $corpus.data.dz > $corpus.tag.txt
|
/net/corpora/nlnieuws/namen.sh -x T -s $corpus.data.dz > $corpus.tag.txt
|
||||||
|
|
||||||
cd ../..
|
cd ../..
|
||||||
rm -fr out
|
rm -fr out
|
||||||
|
|||||||
@@ -57,8 +57,8 @@ cd xml
|
|||||||
alto -o $corpus.data.dz *.xml 2> /dev/null
|
alto -o $corpus.data.dz *.xml 2> /dev/null
|
||||||
|
|
||||||
# telling per bericht, niet per zin
|
# telling per bericht, niet per zin
|
||||||
/net/corpora/nlnieuws/namen.sh -x 9 -s $corpus.data.dz > $corpus.cat.txt
|
/net/corpora/nlnieuws/namen.sh -x C -s $corpus.data.dz > $corpus.cat.txt
|
||||||
/net/corpora/nlnieuws/namen.sh -x 10 -s $corpus.data.dz > $corpus.tag.txt
|
/net/corpora/nlnieuws/namen.sh -x T -s $corpus.data.dz > $corpus.tag.txt
|
||||||
|
|
||||||
cd ../..
|
cd ../..
|
||||||
rm -fr out
|
rm -fr out
|
||||||
|
|||||||
8
namen.sh
8
namen.sh
@@ -7,8 +7,8 @@ usage() {
|
|||||||
echo "
|
echo "
|
||||||
gebruik:
|
gebruik:
|
||||||
|
|
||||||
$PROGNAME [opties] -x 1..8 -i
|
$PROGNAME [opties] -x 1..10 -i
|
||||||
$PROGNAME [opties] -x 1..8 corpusfile(s) en/of corpusdirectory(s)
|
$PROGNAME [opties] -x 1..10 corpusfile(s) en/of corpusdirectory(s)
|
||||||
|
|
||||||
-x : query
|
-x : query
|
||||||
|
|
||||||
@@ -116,13 +116,13 @@ case $XN in
|
|||||||
TEMPLATE='tt:%w\t%P'
|
TEMPLATE='tt:%w\t%P'
|
||||||
XVALID=1
|
XVALID=1
|
||||||
;;
|
;;
|
||||||
9)
|
9|C)
|
||||||
# categorieën
|
# categorieën
|
||||||
EXPR='fp://meta[@name="cat"]/@value'
|
EXPR='fp://meta[@name="cat"]/@value'
|
||||||
TEMPLATE='tt:%m'
|
TEMPLATE='tt:%m'
|
||||||
XVALID=1
|
XVALID=1
|
||||||
;;
|
;;
|
||||||
10)
|
10|T)
|
||||||
# tags
|
# tags
|
||||||
EXPR='fp://meta[@name="tag"]/@value'
|
EXPR='fp://meta[@name="tag"]/@value'
|
||||||
TEMPLATE='tt:%m'
|
TEMPLATE='tt:%m'
|
||||||
|
|||||||
Reference in New Issue
Block a user