1
2
3 import nltk
4 corpus="""(S (S (NP (DT la) (N' (JJ venontajn) (N' (JJ apartajn) (NN pecojn)))) (VP (NP (PRP mi)) (VP (VBP donas)))) (S' (IN ke) (S (NP (DT la) (NN lernantoj)) (VP (VB povu) (VP (VP (VP (VB ripeti) (RB praktike)) (NP (NP (DT la) (NN regulojn)) (PP (IN de) (NP (DT l') (N' (NN gramatiko) (JJ internacia)))))) (VPC (CC kaj) (VP (VP (VB kompreni) (RB bone)) (NP (NP (NP (DT la) (NN signifon)) (NPC (CC kaj) (NP (DT la) (NN uzon)))) (PP (IN de) (NP (DT l') (N' (NN sufiksoj) (NC (CC kaj) (NN prefiksoj)))))))))))))
5 (S (NP (NN amiko)) (VP (VB venis)))
6 (S (NP (DT unu) (PP (IN el) (NP (DT la) (NN amikoj)))) (VP (VB venis)) )
7 (S (NP (DT la) (NN amiko)) (VP (VB venis)))
8 (S (NP (NP (DT la) (N' (JJ konata) (NN amiko))) (NPC (CC aŭ) (NP (NP (DT la) (NNS amiko)) (S (NP (DT kiun)) (VP (NP (PRP oni)) (VP (VBD atendis))))))))
9 (S (VP (VP (VB donu) (PP (IN al) (NP (PRP mi)))) (NP (NN libron))))
10 (S (VP (VP (VB donu) (PP (IN al) (NP (PRP mi)))) (NP (NP (DT la) (NN libron)) (S (NP (DT kiun)) (VP (NP (PRP vi)) (VP (VB promesis) (PP (IN al) (NP (PRP mi)))))))))
11 (S (NP (DT (DT tiu) (RB ĉi)) (NN ĝardeno)) (VP (VB estas) (NP (NP (JJ amata) (NN loko)) (PP (IN de) (NN birdoj)))) )
12 (S (NP (DT la) (NN fenestro)) (VP (VB estas) (NP (NP (JJ amata) (NN loko)) (PP (IN de) (NP (DT la) (NN birdoj))))))
13 (S (NP (PRP niaj) (NN birdoj)))
14 (S (NP (DT la) (N' (NN vorto) (NN "la"))) (VP (VB estas) (VP (VB nomata) (NP (NN artikulo)))))
15 (S (NP (PRP ĝi)) (VP (VB estas) (VP (VB uzata) (NP (DT tian) (S (NP (DT kian)) (VP (NP (PRP ni)) (VP (VB parolas) (PP (IN pri) (N' (NN objektoj) (JJ konataj))))))))) )
16 (S (PP (IN anstataŭ) (NP (NN "la"))) (S (NP (PRP oni)) (VP (VP (VB povas) (RB ankaŭ)) (VP (VP (VB diri) (NP (NN "l'"))) (PP (IN se) (S (NP (PRP ĝi)) (VP (RB ne) (VP (VB estos) (RB malbonsone)))))))) )
17 (S (S (PP (IN se) (S (NP (DT iu)) (VP (VP (VP (RB ne) (VB komprenas)) (RB bone)) (NP (NP (DT la) (NN uzon)) (PP (IN de) (NP (DT la) (NN artikulo))))))) (S (NP (PRP li)) (VP (VP (VB povas) (RB tute)) (VP (NP (PRP ĝin)) (VP (RB ne) (VB uzi)))))) (SC (CC ĉar) (S (NP (PRP ĝi)) (VP (VB estas) (NP (NP (JJ oportuna)) (NPC (CC sed) (NP (RB ne) (JJ necesa))))))))""".split('\n')
18