Module corpus
[hide private]
[frames] | no frames]

Source Code for Module corpus

 1  # -*- coding: UTF-8 -*- 
 2  # Dua Libro, sen antaŭparolo 
 3  import nltk 
 4  corpus="""(S (S (NP (DT la) (N' (JJ venontajn) (N' (JJ apartajn) (NN pecojn)))) (VP (NP (PRP mi)) (VP (VBP donas)))) (S' (IN ke) (S (NP (DT la) (NN lernantoj)) (VP (VB povu) (VP (VP (VP (VB ripeti) (RB praktike)) (NP (NP (DT la) (NN regulojn)) (PP (IN de) (NP (DT l') (N' (NN gramatiko) (JJ internacia)))))) (VPC (CC kaj) (VP (VP (VB kompreni) (RB bone)) (NP (NP (NP (DT la) (NN signifon)) (NPC (CC kaj) (NP (DT la) (NN uzon)))) (PP (IN de) (NP (DT l') (N' (NN sufiksoj) (NC (CC kaj) (NN prefiksoj))))))))))))) 
 5  (S (NP (NN amiko)) (VP (VB venis))) 
 6  (S (NP (DT unu) (PP (IN el) (NP (DT la) (NN amikoj)))) (VP (VB venis)) ) 
 7  (S (NP (DT la) (NN amiko)) (VP (VB venis))) 
 8  (S (NP (NP (DT la) (N' (JJ konata) (NN amiko))) (NPC (CC aŭ) (NP (NP (DT la) (NNS amiko)) (S (NP (DT kiun)) (VP (NP (PRP oni)) (VP (VBD atendis)))))))) 
 9  (S (VP (VP (VB donu) (PP (IN al) (NP (PRP mi)))) (NP (NN libron)))) 
10  (S (VP (VP (VB donu) (PP (IN al) (NP (PRP mi)))) (NP (NP (DT la) (NN libron)) (S (NP (DT kiun)) (VP (NP (PRP vi)) (VP (VB promesis) (PP (IN al) (NP (PRP mi))))))))) 
11  (S (NP (DT (DT tiu) (RB ĉi)) (NN ĝardeno)) (VP (VB estas) (NP (NP (JJ amata) (NN loko)) (PP (IN de) (NN birdoj)))) ) 
12  (S (NP (DT la) (NN fenestro)) (VP (VB estas) (NP (NP (JJ amata) (NN loko)) (PP (IN de) (NP (DT la) (NN birdoj)))))) 
13  (S (NP (PRP niaj) (NN birdoj))) 
14  (S (NP (DT la) (N' (NN vorto) (NN "la"))) (VP (VB estas) (VP (VB nomata) (NP (NN artikulo))))) 
15  (S (NP (PRP ĝi)) (VP (VB estas) (VP (VB uzata) (NP (DT tian) (S (NP (DT kian)) (VP (NP (PRP ni)) (VP (VB parolas) (PP (IN pri) (N' (NN objektoj) (JJ konataj))))))))) ) 
16  (S (PP (IN anstataŭ) (NP (NN "la"))) (S (NP (PRP oni)) (VP (VP (VB povas) (RB ankaŭ)) (VP (VP (VB diri) (NP (NN "l'"))) (PP (IN se) (S (NP (PRP ĝi)) (VP (RB ne) (VP (VB estos) (RB malbonsone)))))))) ) 
17  (S (S (PP (IN se) (S (NP (DT iu)) (VP (VP (VP (RB ne) (VB komprenas)) (RB bone)) (NP (NP (DT la) (NN uzon)) (PP (IN de) (NP (DT la) (NN artikulo))))))) (S (NP (PRP li)) (VP (VP (VB povas) (RB tute)) (VP (NP (PRP ĝin)) (VP (RB ne) (VB uzi)))))) (SC (CC ĉar) (S (NP (PRP ĝi)) (VP (VB estas) (NP (NP (JJ oportuna)) (NPC (CC sed) (NP (RB ne) (JJ necesa))))))))""".split('\n') 
18