Autor: Danijel Turina Datum: 2010-03-09 11:09:48 Grupe: hr.soc.religija Tema: Re: Vreme za testiranje Linija: 57 Message-ID: hn56pc$ot1$2@ss408.t-com.hr |
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA512 Ged wrote: > Steta. Nadao sam se da je neko otkrio jednostavan nacin da se koristi > Googlova baza podataka. Ma google namjerno otežava pristup zato da drugi nebi njima mogli napraviti ono što oni rade drugima, kad recimo pokupe vijesti s drugih sajtova i tako im kradu promet. Oni žele biti jedina točka pristupa podacima. > Nema potrebe dalje se truditi oko ovoga. Po rezultatima vidim da bi u > program bilo potrebno ubaciti relativno komplikovan kod. Analiza raznih > formata kod oznacavanja citata tudjeg teksta nije tako jednostavna, a zato > sto vecina pise jako kratke poruke oni u svom ukupnom zbiru nemaju dovoljno > teksta da bi statisticka analiza bila jednostavna. Trebalo bi uzeti vise > godina unazad. Takvo nešto sam i ja zaključio, naime bez komplicirane gramatičke analize gdje bih riječi svodio na korijene i tako eliminirao deklinacije i slične stvari, te eliminirao opsežne citate, ne-riječi i tipfelere, od toga ništa. Isplatilo se probati ali jebiga. > Steta sto nemas vecu bazu poruka. Secam se da su ranije u YU news > hijererahiji neki ljudi jednostavno podigli svoj news server pod > Linuxom, pa > zatim redovno arhivirali zanimljive konferencije. Ne bi bilo lose za > uspomenu i stare dane imati arhivu sa dokaznim materjalom: > "Kako sam upropastio silno vreme, onda kad sam ga jos imao" :))) > > Sem toga, nikad se ne zna kad moze zatrebati, za dobro ili lose. Ma, imam ja bazu podataka sa svojim porukama, u koju svakih par minuta skripta doda sve što se novo pojavilo na news serveru, ali ne isplati mi se arhivirati poruke svih sudionika budući da je to rupa bez dna. Ne želim napraviti tako veliku bazu podataka da postane prevelika za backup. U teoriji, mogao bih se pretplatiti na nešto poput giganews i polako povući zadnjih nekoliko godina poruka, ali morao bih imati dobar razlog za to budući da bi to bilo logistički komplicirano. Arhivirati moje poruke mi ima smisla, postojala je potreba za tim budući da se dosta ljudi mučilo s googlom i fragmentiranim arhivama a zanimale su ih samo moje poruke. Onda smo se organizirali pa su oni prikupili podatke, a ja sam napisao kod. Arhivirati sve je nezahvalan posao. Kad si samo zamislim da bih u bazi držao svo smeće koje su razni mrakovi ovdje naštancali kroz godine, dođe mi zlo. Neka radije to zlo proguta zaborav. - -- http://www.danijel.org/ -----BEGIN PGP SIGNATURE----- Version: GnuPG v1.4.9 (GNU/Linux) iEYEAREKAAYFAkuWHmsACgkQU8G6/NHezOf6iACgiQSwPka2e43z/z9sLLt4A13k wZoAniXCVZv4wWw7ueZ5USfm0ROQ5NXG =pLD4 -----END PGP SIGNATURE----- |