Metin Arama
Giriş
Tatoeba'da metin aramanın iki yöntemi vardır:
Her sayfanın üst kısmında yer alan arama çubuğudan yapılan normal arama
Arama çubuğunun üst kısmından ulaşılabilen Gelişmiş arama bölümünden yapılan daha detaylı arama
Normal Arama
Normal arama üç bölümden oluşur:
(1) Arama yapılan metnin girildiği ana bölüm
(2) Girilen metnin hangi dilde olduğunun seçildiği "Şu dilden" bölümü
(3) Arama sonuçlarının seçilen dilde doğrudan ya da dolaylı çevirisi bulunan cümlelerle sınırlandırıldığı "Şu dile" bölümü.
Ana Bölüm
Ana bölüm boş bırakıldığında "Şu dilden" bölümüyle "Şu dile" bölümünde seçilen diller arasındaki tüm cümleler görüntülenir. Bu bölüme kelime girildiğinde ise bu kelimeleri içeren cümleler aranır.
Tatoeba'da kullanılan arama motoru Manticore, daha önce kullanmış olabileceğiniz Google vb. arama motorlarından biraz daha farklıdır. Şunları bilmenizde yarar var:
(1) ? ve ! gibi noktalama işaretlerinin Manticore (eski adıyla Sphinx) arama motorunda teknik bazı işlevleri vardır. Eğer bu özel amaçlarla kullanmayacaksanız aramak istediğiniz metinden bunları çıkarmalısınız.
(2) Türkçe, Almanca, Arapça, Danca, Fince, Fransızca, Hollandaca, İngilizce, İspanyolca, İsveççe, İtalyanca, Macarca, Norveççe, Rumence, Rusça ve Yunanca gibi dillerde bir kelime arandığında arama sonuçlarında o kelimenin sonuna ek gelmiş biçimleri de yer alır (Örn. "yaşam" kelimesi arandığında "yaşamak", "yaşamda" ve "yaşamım" gibi ekli biçimler de arama sonuçlarında çıkar). Eğer ekli biçimleri değil, sadece arama yaptığınız biçimin görüntülenmesini istiyorsanız kelimenin başına = işareti koymanız gerekir (=yaşam).
(3) Eğer Japonca ve Çince gibi kelime aralarına boşluk konmayan dillerde arama yapıyorsanız alt kısımdaki Kelimeler arasında boşluk bulunmayan diller bölümünü inceleyebilirsiniz.
(4) Bir kelime grubunu kalıp biçiminde toplu olarak aramak için tırnak içine alabilirsiniz. Mesela onunla buluştum ifadesini aradığınızda yan yana olmasalar da onunla ve buluştum kelimelerini içeren cümleler görüntülenecektir. Tırnak içine alarak "onunla buluştum" biçiminde arama yaptığınızda ise sadece bu kelimelerin yan yana olduğu cümleler görüntülenecek, "onunla dün akşam buluştum" gibi araya başka kelimelerin girdiği cümleler arama sonuçlarında yer almayacaktır.
(5) Daha fazla bilgi için Örnekler bölümünü inceleyebilirsiniz.
"Şu dilden" bölümü
"Şu dilden" bölümü "Herhangi bir dil" olarak seçilebilir. Bu durumda yapılan aramada eşleşen tüm dillerden sonuçlar çıkar. Bir dil seçildiğinde ise arama sadece o dildeki cümleler içinde yapılır.
"Şu dile" bölümü
"Şu dile" bölümü "Herhangi bir dil" olarak seçilirse yok sayılır. Bir dil seçildiğinde ise aramada sadece o dilde çevirisi olan cümleler yer alır. Bunlar siyah renkteki doğrudan çeviriler olabileceği gibi gri renkteki dolaylı çeviriler de olabilir. Dolaylı çeviriler, doğrudan bağlantısı yapılmamış, çevirinin çevirisi niteliğinde çevirilerdir. Böyle cümleler anlam olarak birbirine denk olmayabilir.
Örnekler
İçinde "yap", "yapar", "yapıyor" veya "yaptı" geçen cümleleri bulmak için arama kısmına "yap" yazılmalıdır. (Arama motorunda büyük-küçük harf duyarlılığı yoktur, dikkate alınmaz.)
Aramaya ekli versiyonları dahil etmeyip sadece girilen biçimde aramak için ifadenin önüne eşittir işareti (=) getirilmelidir.
Arama yaparken cümledeki noktalama işaretlerini yazmaya gerek yoktur. Noktalama işaretlerinin çoğu aramada dikkate alınmaz, ama ünlem (!) ve soru (?) işaretlerinin arama motorunda özel bazı işlevleri olduğu için bu işaretlerin kullanılması arama sonuçlarını farklı biçimde etkileyebilir.
Aranan kelime ile sona eren cümleleri bulmak için o kelimenin başına $ işareti konmalıdır. Şu örnek, sonu "Tom" ile biten cümleleri görüntüler.
Çoğu işaret arama yaparken kullanılamaz. Ama $ ve _ işaretleri istisnadır. Bu işaretleri önüne \ getirerek arayabilirsiniz.
Aranan kelime ile başlayan cümleleri bulmak için o kelimenin başına ^ işareti konmalıdır. Şu örnek, "Tom" ile başlayan cümleleri arar.
Şu örnek, "Tom" ile başlayıp "Mary" ile biten cümleleri arar.
Şu örnek, "Türkiye" veya "İstanbul" ile başlayan cümleleri arar.
Şu örnekte "yapıyor", "yaptı" veya "yapar" kelimelerini içeren cümleler görüntülenir. = işareti birebir eşleme görevi gördüğü için bu aramada "yapacak" ve "yapmaz" gibi kelimenin diğer biçimlerini içeren cümleler yer almaz.
Bir ifadeyi bütün olarak aramak için başına ve sonuna tırnak işareti (") konmalıdır. İfadenin ek getirilmiş başka versiyonlarının aramaya dahil edilmek istendiğinde ise ya tırnak işaretinden önce ya da tırnak işaretinin içinde her kelimenin başına = işareti koyulması gerekir.
Şu örnekte "buraya gel", "buraya geldin", "buraya geldim", "buraya gelsin" gibi farklı biçimdeki birçok cümle görüntülenir.
Arama şu biçimlerden biriyle yapıldığında ise sadece "buraya gel" ifadesini içeren cümleler görüntülenir, diğer biçimler arama sonuçlarında yer almaz.
Şu örnek ise ilave başka kelimeler içermeyen, sadece "Buraya gel" cümlesini arar. "Çabuk buraya gel", "Buraya gel hadi" gibi örnekler yer almaz.
Şu örnekte içinde "Tom" kelimesi geçen, ama "Tom" ile başlamayan cümleler aranır.
Şu örnekte de benzer biçimde "Tom" kelimesi geçen, ama bu sefer hem "Tom" ile başlamayan hem de "Tom" ile bitmeyen cümleler görüntülenir.
Soru işareti (?) arama yaparken joker karekter görevi görür.
Şu örnekte "hastane", "pastane" ya da "postane" kelimelerini içeren her üç gruptaki cümleler de aranır.
Şu örnekte "ben" ve "çok" kelimelerini içeren ve bu iki kelimenin arasında üç tane daha kelime olan cümleler aranır.
Şu örnekte ise "ben" ile başlayıp "insanım" ile biten ve aralarında iki tane daha kelime olan cümleler aranır.
Şu örnek, "çık" ile başlayan kelimeleri içeren cümleleri (eksiz, sadece "çık" biçimi de dahil) arar.
Şu örnek, "çık" ile biten kelimeleri içeren cümleleri (sadece "çık" da dahil) arar.
Şu örnek, herhangi bir yerinde "çık" ifadesi geçen kelimeleri içeren cümleleri arar.
Şu örnek, "Boston" kelimesini içerip "Tom" kelimesini içermeyen cümleleri arar.
Şu örnek, "kedi" kelimesinin "köpek" kelimesinin önünde olduğu cümleleri arar.
Şu örnek, "kedi", "köpek" ve "balık" kelimelerinden en az ikisini içeren cümleleri arar.
Arama yaparken bulunacak sonuçların daraltılmasıyla ilgili İngilizce bir örnek:
Şu aramada "I can't" ile başlayan cümleler görüntülenir.
Şunda ise "I can" veya "I can't" içeren iki türdeki cümleler de görüntülenir.
"I can't" içeren cümleleri aramaya dahil etmeden sadece "I can" içeren cümleleri bulmak içinse arama şu şekilde yapılmalıdır. (Tırnak işaretleri gereklidir.)
Tatoeba'daki cümlelerin birçoğunda şablon isim olarak Tom, Mary, John ve Boston kullanıldığı için arama yaparken bu kelimeleri içeremeyen cümleleri bulmak isteyebilirsiniz. Bunun için aramak istediğiniz kelimeye ilave olarak -Tom -Mary -John -Boston ifadelerini de eklemeniz gerekir.
Şu örnek, "araba" kelimesini içeren ama Tom, Mary, John ve Boston kelimelerini içermeyen cümleleri arar.
Tom, Mary, John ve Boston kelimelerini içermeyen tüm cümleleri bulmak istediğinizde ise arama şu şekilde yapılabilir. (Sadece -Tom -Mary -John -Boston diye aramak hata verecektir.)
Şu örnek, "of" kelimesinin hemen ardından "-ing" ile biten kelimelerin geldiği İngilizce cümleleri bulur. (Örn. "I am afraid of dying.")
-
-"*ing of" kısmı eklenmediği takdirde ise aramada bu biçimdeki cümleler de yer alır. (Örn. "I'm thinking of you.")
-
Kelimeler arasında boşluk bulunmayan diller
Kelimeler arasında boşluk bulunmayan Japonca ve Çince gibi dillerde arama yapılırken arama motoru her karakteri ayrı kelime olarak ele alır. Örnek olarak 逆に ve 逆 に ifadeleri aratıldığında aynı sonuçlar çıkar, ayrıca karakterlerin sırası dikkate alınmaz. Aramada sıranın da dikkate alınması için ifade tırnak içine alınarak "逆に" şeklinde aranmalıdır.
Bazı ayrıntılar
Aramada büyük-küçük harf ve noktalama işaretleri dikkate alınmaz. (Bazı noktalama işaretlerinin istisnai teknik işlevlerine daha önce değinilmişti.)
Kelimelerin ek alabildiği dillerde arama yaparken kelimenin sadece belirlenen biçimdeki örneklerinin bulunması ve diğer ekleri içeren biçimlerinin yer almaması için önüne = işareti konmalıdır. Google'da arama yaparken aynı amaçla tırnak işareti kullanıldığı için bu işlem kullanıcılara yabancı gelebilir. Tatoeba'da kullanılan Manticore arama motorunda tırnak işaretinin işlevi daha farklıdır; tırnak içine alınan ifadenin ekli olup olmaması dikkate alınmaz, sadece kelimelerin sırasının tırnak içindeki biçimde olmasını sağlar.
Şu örnek sadece içinde "su iç" ifadesi geçen cümleleri bulur. Ek almış diğer biçimler yer almaz.
Şu örnek ise "suyu içtim", "su için" gibi ek almış diğer biçimlerdeki cümleleri de arar.
Bu şekilde arama yaparken ^ (düzeltme) işareti kullanılarak cümlenin hangi kelimeyle başlayacağı da belirlenmek istenirse ^ işareti = işaretinden önce değil, sonra kullanılmalıdır.
Aksi hâlde şu örnekte olduğu gibi ^ işareti dikkate alınmaz.
Arama yaparken * (yıldız) işareti kelimenin başına, ortasına ya da sonuna konabilir; ama başa konacağı zaman yıldızdan sonraki kısım en az üç karakter içermelidir, aksi hâlde arama başarısız olur. Örneğin şu aramada hiçbir sonuç çıkmaz:
Karakter sayısı üç veya daha fazla olduğundaysa çok sayıda sonuç çıkar:
Transkripsiyon ve farklı yazı türlerinde arama
Bazı diller birden çok alfabe ve yazı türüyle yazılabilir, Basitleştirilmiş/Geleneksel Çin yazısı ve Özbek Latin/Kiril alfabeleri gibi. Ayrıca bazı dillerde transkripsiyonlar da kullanılmaktadır, Çince-Pinyin ve Japonca-Furigana gibi.
Bir ifade aranırken hem cümle metninde hem de alternatif alfabe ve transkripsiyonlarda arama yapılır. Dolayısıyla ifade sadece transkripsiyonda geçse de arama sonucunda görüntülenir. Ayrı ayrı sadece cümle metninde veya transkripsiyonda arama yapmak istendiğinde başa @text veya @transcription konmalıdır.
Şu örnek, Furigana olarak かな ifadesini içeren içren cümleleri arar.
Şu örnek, cümle metninde 国 ve Furigana olarak da くに ifadesini içeren cümleleri arar.
Şu örnek, cümle metninde 国 içeren ve Furigana olarak くに ifadesini içermeyen cümleleri arar.
Şu örnek, cümle metninde 著 ve Pinyin olarak da zháo ifadesini içeren cümleleri arar.
Arama operatörleri
Dik çizgi (|) "veya" anlamında olup, girilen birden fazla ifadeden herhangi birini içeren cümleleri aramayı sağlar.
Şu örnek, "basketbol" ve "voleybol" kelimelerinden birini içeren (ikisi birden de olabilir) cümleleri arar.
Aramaya başka kelime de ilave edilmek istendiğinde "veya" operatörüyle kullanılan kelimeleri paranteze almak gerekir. Mavi veya kırmızı ev ifadelerini arayan bir örnek:
Arama yaparken bir ifadeyi içeren cümleleri arama sonuçlarına dahil etmemek için önüne - ya da ! işaretleri getirilmelidir.
Bir kelimenin önüne ^ (düzeltme) işareti konduğunda aramada sadece o kelimeyle başlayan cümleler yer alır.
Bir kelimenin sonuna $ (dolar) işareti konduğunda aramada sadece o kelimeyle biten cümleler yer alır.
Cümleyi sadece girilen biçimde, ilave başka kelime ve biçim içermeksizin aramak için tırnak, düzeltme ve dolar işaretleri kombine olarak kullanılabilir. Bir örnek:
Sıralama operatörü (<<), arasına konduğu ifadelerin cümlede hangisinin daha önde olacağını belirleyip aramada sadece bu biçimdeki cümleleri bulmaya yarar.
Şu örnek, köpek kelimesinin kedi kelimesinden önce geldiği cümleleri arar.
Sıralama operatörünün bir işlevi de aynı kelimeyi birden çok kez içeren cümleleri bulmak için kullanılabilmesidir. Şu örnek, "hiçbir" kelimesinin üç kez geçtiği cümleleri arar.
Yakınlık (proximity) operatörü ile aranan kelimelerin arasında daha farklı kaç kelime girebileceğinin sınırlaması yapılır. Bu sınır, yazılan sayının bir noksanıdır. N bir pozitif sayı olmak üzere ifadenin sonuna ~N biçiminde eklenerek kullanılır.
Şu örnekte "sen" ve "güzelsin" kelimeleri arasında başka hiçbir kelime olmayan cümleler aranır.
Şu örnekte ise "Sen çok güzelsin", "Sen oldukça güzelsin" gibi araya başka bir kelimenin girdiği cümleler de görüntülenir.
Yetersayı (quorum) operatörü, girilen ifadedeki kelimelerden kaçını içeren cümlelerin aramada bulunacağının belirlenmesini, başka bir deyişle esnek arama yapmayı sağlar. N bir pozitif sayı olmak üzere ifadenin sonuna /N biçiminde eklenerek kullanılır.
Şu örnek "pizza yemeyi sevmez" ifadesindeki kelimelerin iki veya daha fazlasını içeren cümleleri arar.
Dolayısıyla arama sonuçlarında hem "sebze yemeyi sevmez" hem de "pizza yemeyi sever" gibi bu kriterlere uyan farklı biçimdeki ifadeler yer alır.
MAYBE (BELKİ) operatörü, arama yapılırken konduğu yerin sağındaki ifadeleri içeren cümleleri ön sıralarda gösterip, o ifadeleri içermeyen cümleleri de arama sonuçlarına dahil eder. Bir tür esnek arama yöntemidir ve mutlaka büyük harflerle yazılmalıdır.
Şu örnek, "bugün okula gelmedi" ifadesini içeren cümleleri başta göstermekle birlikte "bugün okula gitmiyorum" gibi farklı cümleleri de görüntüler.
Aramayla ilgili diğer fonksiyonlar hakkında bilgi edinmek için Manticore dökümantasyonunu inceleyebilirsiniz.