Egyetemközi Távközlési és Informatikai Központ

   

 Adatbányászat és Webes Keresés












 

A kutatócsoport

Az Adatbányászat és Webes Keresés kutatócsoport 2000-ben alakult. K+F tevékenységünk során egyedi megoldásokat biztosítunk extrém nagy rendszerek (nagy belső hálózatok, nagy forgalmú portálok) számára. A magyar és hasonlóan összetett szintaxisú nyelveken való információkeresést számítógépes nyelvész csoportokkal együttműködve valósítjuk meg. Adatbányászati eszközöket fejlesztettünk szociális hálózatok, ügyfélszolgálati adatok és biztonsági incidensek vizsgálatára.

"Managing Terabytes"                                                            

Egyedi termékfejlesztés extrém adatmennyiségeken.
Szakértelem adatbányászat és Webes keresés területén:

    • hasonlóságkeresés,
    • gyakori mintázatok keresése
    • klaszterezés
    • klasszifikáció

Referenciamunkák                                                       

  • Keresőrendszer, a Magyar Telekom Csoport és az

AEGON Magyarország belső hálózatán.
Publikus magyar kereső: http://search.sztaki.hu

  • Web log adatbányászati eszköz fejlesztés,

T-Online Magyarország.

  • Eszköz híváshálózatok klaszterezésére, T-Com
  • Ügyfélismereti eszköz, AEGON Magyarország
  • Gyógyszermolekula lenyomatok klaszterezésére,

Richter Gedeon Rt.

Publikációk (Válogatva )

 

András A. Benczúr, Károly Csalogány, Tamás Sarlós: Link-Based Similarity Search to Fight Web Spam. in Proc. Airweb 2006 in conjunction with SIGIR 2006.
Z. Dezso, E. Almaas, András Lukács, Balázs Rácz, I. Szakadát, A.-L. Barabási:Fifteen Minutes of Fame: The Dynamics of Information Access on the Web, Phys. Rev. E 73, 066132 (2006)
Tamás Sarlós: Improved Approximation Algorithms for Large Matrices via Random Projections, FOCS, 2006.
A. A. Benczúr, István Bíro, Károly Csalogány, Balázs Rácz, T. Sarlós,and Máté Uher: PageRank és azon túl: Hiperhivatkozások szerepe a keresésben. Magyar Tudomány, 1325-1331, 2006.
Tamás Sarlós, András A. Benczúr, Károly Csalogány, Dániel Fogaras, Balázs Rácz: To Randomize or Not To Randomize: Space Optimal Summaries for Hyperlink Analysis. In Proc WWW 2006
A. A. Benczúr, Péter Schönhofen: Feature selection based on word-sentence relation. ICMLA 2005

Kapcsolattartó: Benczúr András, Ph.D., tudományos főmunkatárs

 

 
       
   
Webmester: Samu Péter
 
 

Egyetemközi Távközlési és Informatikai Központ © Minden jog fenntartva 1998 - 2011