Bioinformaatika ja andmekaeve labor Tartu Ülikoolis

TÜ ATI Bioinformaatika ja andmekaeve õppetooli välja arendamine biit.cs.ut.ee

Moto: Torture the Data until it confesses

Teadustöö käivitamise periood ehk kust kõik alguse sai

Veidi ajaloolisest taustast: pärast õpinguid Helsingi Ülikoolis ning tööd Euroopa Bioinformaatika Instituudis Cambridge’is võtsin 2002. aasta suvel vastu EGeeni kutse naasta Eestisse ning hakata Eesti Geenivaramu projekti edendama. Pidin käivitama bioinformaatika uurimistöö ja IT-süsteemide arenduse. Kui tahtsin luua oma tudengitele ühise meililisti, vajas see lühikest nime. Sõnadest BioInformaatika ja IT moodustus suupärane BIIT ja 26. septembril 2003 sai listi lisatud 20 nime. Ülikooliga liitusin ametlikult alles 2004. aastal, kui pidasin loengukursuse tekstialgoritmidest. Aastal 2006 aitasin kokku panna Tartu Ülikooli arvutiteaduse instituudi (ATI) kõiki aktiivseid teadlasi koondava sihtfinantseerimise teema, mis sai ka rahastuse. ATI sihiteemade taotlused lükati varem kolm aastat järjest tagasi. Seega võib öelda, et sel ajal IT Eestis küll prioriteet ei olnud. Suurem muudatus toimus instituudis 2007. aastal, kui sügisel valiti uuteks professoriteks mind, Varmo Vene ja Marlon Dumas, samuti jätkas Eero Vainikko. Tegelikult võibki kirjeldada aastaid 2002–2007 teadustöö käivitamise perioodina. Selle lõpuks jõudis produktiivsesse faasi mitu doktoranti ning käivitus aktiivne teadustöö BIITi labori nime all.

Kuigi BIIT sai alguse bioinformaatikast, on selle oluliseks osaks algoritmid, andmekaeve ja masinõpe. Õppekavade reformi käigus moodustasime Tartu Ülikoolis magistrantuuri spetsialiseerumise suuna “Algoritmiline andmeanalüüs ja bioinformaatika”. Selle suuna põhiaineteks said andmekaeve, tekstialgoritmid, bioinformaatika ja masinõpe. Lisaks julgustame tudengeid valima statistika ja molekulaarbioloogia/geneetika ning teadusarvutuste aineid. Samal ajal langes mulle ka uue kohustusliku magistriaine “Algoritmika” väljatöötamine ja lugemine.

Tulemused

On selge, et üks inimene ei saa üksi vedada kõiki vajalikke loengukursuseid, taotleda ja juhtida projekte ning aidata kümneid tudengeid bakalaureusest doktorantuurini. Seetõttu on jätkusuutlikkuse jaoks hädavajalik, et oleks olemas veidi laiem õppejõudude ja juba kraadiga teadurite ring, kes aitaks seda koormust jagada. 2009. aasta kevadel taotlesime BIITi õppetooli arendamiseks EITSA rahastust ning projekt käivituski 2009. a septembris. Aastate 2009–2011 tulemused on seega osaliselt varasema töö vili. EITSA rahastus on võimaldanud:

  • tagada lisarahastuse loengukursuste vedamiseks (Sven Laur, Balaji Rajashekar) ja tasustada külalisi tunnitasude alusel,
  • õppetooli tudengitel õppida rahvusvahelistes koolides,
  • korraldada õppetooli ja selle projektide administreerimist,
  • programmeerida abivahendeid ja veebikeskkondi õppetöö toeks.

Samal ajal on õppetooli välja arendamise tulemustest võimalik välja tuua just doktorantide teadustöö edu ning ainekursuste välja töötamise.

Kaitstud on kaks doktorikraadi – Jüri Reimand (juuni 2010) ja Meelis Kull (august 2011). Jüri sai seejuures enam-vähem kõik võimalikud ja võimatud riiklikud preemiad ja auhinnad. Praegu on Jüri järeldoktorantuuris Toronto ülikoolis.

Doktoritööde lõppfaasi on jõudmas Hedi Peterson, Priit Adler, Konstantin Tretjakov ja Raivo Kolde. Praegu on rühmas kokku 12 doktoranti, kellest kaks on välismaalased – Vijayachitra Modhukur ja Elena Nikolaeva. Sotsiaalvõrkude analüüsiga tegeleb Anna Leontjeva. Meditsiiniliste tekstide andmekaevega tegelevad Aleksandr Tkatšenko ja Raul Sirel. Rühma interdistsiplinaarsust kasvatab veel Sten Ilmjärv, kes on neuroteaduste doktoriprogrammis. Sel aastal alustasid Tauno Metsalu (TÜ statistika magister) ja Kristjan Korjus (MSc Manchesteri ülikoolist) vastavalt bioinformaatika ja neuroteaduste andmeanalüüsiga. BIITi juures on tudengeid informaatika, statistika, lingvistika, geenitehnoloogia ja matemaatika taustaga. Riiklikke preemiaid on saanud Jüri Reimand, Konstantin Tretjakov ja Kaur Alasoo. Kusjuures Kauri juhendajateks olid Hedi Peterson ning Phaedra Agius (järeldoktorant, kes viibis Eestis 2008. a kevadel ja pidas masinõppe loengukursuse).

Õppejõudude poolel on õpetamise koormust jagamas kaks teadurit – Balaji Rajashekar (PhD Lundi ülikoolist), kes tuli Tartu Ülikooli järeldoktorandi staatuses, ja Sven Laur (PhD Helsingi tehnikaülikoolist). Balaji on enda peale võtnud bioinformaatika loengukursuse ning seminari korraldamise. Sven Laur on aga väga mitmekülgse taustaga krüptograafiast andmekaeve ja bioinformaatikani. Ta on korraldanud mitmeid aktiivseid seminare masinõppe ja andmekaeve, pilditöötluse, ning graafide analüüsialgoritmide vallas. 2012. a kevadel korraldab Sven koos Meelis Kulli, Konstantin Tretjakovi, Anna Leontjeva ja Raivo Koldega masinõppe kursuse. Et tagada pikem jätkusuutlik õppetöö algoritmide, andmekaeve, masinõppe ja bioinformaatika vallas, oleks aga vajalik vähemalt kahe-kolme lektori-dotsendi kaasamine. Siis saaks lisaks korraldada kursuseid ka bakalaureuse tasemele ning mõelda paremini populariseerimisele. Paraku pole selleks kohe ressurssi ega ka inimesi veel kusagilt võtta. Appi tulevad ajutised välislektorid, näiteks korraldame regulaarselt Eesti Arvutiteaduse suvekoole, kuhu on tulnud väga häid lektoreid igal aastal.

BIITi rühma põhitegevus ja tugevus on aga selgelt teadustöö, mis on võimaldanud kaasata ja lisatasustada doktorante, kellest kasvavad tulevased õppejõud. Peamine on just koostöö mitme EU projektiga vähi, tüvirakkude, toksikoloogia ja epigeneetika alal, samuti osaleme Eesti Arvutiteaduse tippkeskuse töös ja Tarkvara TAKi (www.stacc.ee) andmekaeve projektides. Samuti loodame liituda Euroopa bioinformaatika infrastruktuuri ELIXIR välja ehitamise projektiga ning käivitada Eestis vastav stabiilne teenusekeskus.

Tags:

Autorist