Tuesday 2 April 2013

Decision Tree (C4.5), Online ad. (Russian), Инфернальный пиздец и Водяной Бластер

Работая над рекомендательной системой для рекламной платформы иногдда встречаешься с интересными эффектами.


Пример:



Текст:

Перекресток около моего д
ома. И каждый день такая херня: Пешеходам зелёный горит уже пару секунд, однако,
 машины продолжают фигачить на красный, 60-80 км/ч не меньше.…. . . ru_auto: нен
ависти псто!. Перекресток около моего дома.И каждый день такая херня:Пешеходам з
елёный горит уже пару секунд, однако, машины продолжают фигачить на красный, 60-
80 км/ч не меньше.Я, если курю в этот момент, непременно целюсь окурком в открыт
ую форточку.Если не курю или форточка закрыта, просто плюю в лобовое.Посоветуйте
! Бластер, калашников, булыжник - что эффективнее помогает водятелам запомнить П
ДД?UPD Как здесь пешеходов-то не любят... Инфернальный пиздец просто!UPD2 Больши
нство предпочитает переть на красный свет, по хрен жертвы.Но вот получить плевок
 в лобовое - это для них катастрофа!.

============

Рекоммендация:

Водяной бластер

===============


Хорошая рекомендация! :-)


+++++++++++++++++++++++++++



 но вот интересно, что у биграммы: "инфернальный пиздец" tfidf  необычайно высок, так как это не самое часть встречающееся словосочетание.

как результат - дерево решений крепко связывает "инфернальный пиздец" и "водяной бластер".

Как результат - на статью про "инфернальный пиздец" мы рекомендуем купить... - правильно. Водяной бластер.


================



Alexander PolyakovЭтот рекомендер — лучшая технология. С ней можно будет по телевизору выступать. Типа ответ на все извечные вопросы кто виноват и что делать. Пиздец-бластер. Вот эти пары станут мемами и пойдут в продажу как отдельные товары массового потребления. 

На статью о грязной рубашке и совете отстирать ее мылом мы получим Срач-мыло и т.д. Любое нейминг агентство позавидует. 

Спасибо, посмеялся в голос!



Wednesday 7 November 2012

Machine Learning library/framework + fuzzy logic.

One additional feature in process - fuzzy logic for cases when we have not full attribute set
or if there is no strict solution, based on training set. 

Machine Learning library/framework

Subj - works!

Tree training/creation, serialization and storing to the redis (for a while - as a java serialization),
loading and using is works pretty good.

Simple training set and unclassified incident is applied.

TODO:

1) new algorithms for dtrees generation.
2) storing/loading tree into the redis not as a serialized object, but as a set of nodes.
3) creation a public version for just using already created trees.

https://github.com/vk4arm/DTree

Sunday 28 October 2012

Machine Learning library: training process for ID3 completed.

TODO:

  1) Tree serialization/saving/restoring
  2) C4.5 implementation
  3) Tree usage https://github.com/vk4arm/DTree

 Right now - just for fun. But tree, generated from the training set looks logical...

Monday 22 October 2012

Machine Learning library - in progress.

I want to manage trees in redis, reuse it, create using id3 and c4.5 tree building algorithms.

https://github.com/vk4arm/DTree

Not yet ready!!!!!!! :-)

Sunday 21 October 2012

How to get free active email to SMS providers list. Or small Oracle software reverse engineering.

Yes, it is possible to googleit, but in this case you should test all gateways, but how to do it without having a phone numbers in all providers you that have found?
Better if somebody will do it for you.

Small hack :-)
Oracle APEX (Oracle Application Express) application - OraTweet contains free sms feature. So, it is possible to get it.

Several words about apex app. This is simple .zip archive, which contains .sql files and some static resources, so, this is possible to find a list of email 2 sms providers in it.



1) Download oratweet:  http://oratweet.com/  -> download

2) Unzip it.

3) Open SMS_GATEWAY.sql in your text editor.

4) ???

5) Profit !!! :-)))