Anahtar Kelime Çıkartma
Cümleyi oluşturan temel olgu kelimelerdir. Bir konuşmadaki konuları anlamak açısından, içindeki önemli kelimelere bakılabilir. İyi bir anahtar kelime çıkarma modeli, aşağıdakilerle ilgili sorunları etkili bir şekilde çözer:
Bir metin birkaç konu ile ilgiliyse, mevcut diğer algoritmalar kelime bazında anahtar kelimeleri çıkarır, ancak konuların anahtar kelimelerini ayrı ayrı temsil etmek istenir. Bunların sonucunda ArKeywordExtractor, denetimsiz öğrenme ve TF/IDF puanlarının kullanıldığı bir hibrit model ile oluşturulmuştur.
ArKeywordExtractor işlem adımları:
Word embedding veya kelime vektörleştirme, kelimelerin birbiriyle olan yakınlıklarını diğer bir deyişle kelime benzerliklerini bulmak için kullanılan, kelimelerin gerçek sayılara karşılık gelen vektörlerle temsil edilmesine olanak sağlayan bir NLP metodolojisidir.
ArKeywordExtractor tarafından kelime vektörleri alınırken FastText algoritmasından yararlanılmaktadır.