Posts Tagged “python”

Als dataminerd ben ik fervent gebruiker van opensource tools voor datamining(R, Weka, Octave, Orange).

Nu ben ik momenteel bezig om voor ons adviesbureau een tooltje in elkaar te draaien dat rss-feeds van vacature sites leeg slurpt. De relevante opdrachten eruit filtert en met CV’s van mede ondernemers combineert en deze gecombineerd bij onze sales in de email bus te laten vallen.

Je zou een geheel Basyaanse aanpak kunnen opzetten waarin je net als een spamfilter leert wat goede en slechte matches (spam/ham) zijn maar in eerste instantie is gekozen voor een direct aanpak met het slim tellen van overeenkomsten in de text. Hirevoor gebruik ik de Natural Language Tool Kit (NLTK) in python en een Nederlandse corpus van Alpino Treebank.

Ik zal jullie op de hoogte houden van verdere voortgang…

Tags: , ,

Comments Geen reacties »