REKLAMA

Wikipedia prześwietlona. Polscy naukowcy sprawdzają jakość artykułów na Wikipedii

Poranek Radia TOK FM - Weekend
Data emisji:
2017-07-09 08:00
Prowadzący:
Czas trwania:
11:18 min.
Udostępnij:

AUTOMATYCZNA TRANSKRYPCJA PODCASTU

Transkrypcja podcastu
Karolina Głowacka z Wikipedii codziennie korzystają miliony użytkowników o jakość artykułów dbają o redaktorze redaktorki Ano właśnie czasem ktoś coś się napisze przekręci nie poprawi ten czy możemy być pewni jak i jaka jest jakość artykułów na Wikipedii czy da się w pewnym sensie zautomatyzować sprawdzanie takiej jakości Otóż proszę sobie wyobrazić, że naukowcy z uniwersytetu ekonomicznego w Poznaniu nie we współpracy ze studentami opracują metody pomagające w Rozwiń » ocenie jakości artykułów właśnie w Wikipedii jest z nami przez Skype, a dr Krzysztof Wencel właśnie Uniwersytetu ekonomicznego w Poznaniu dzień dobry dzień dobry państwu proszę powiedzieć w jaki sposób 3 czy w ogóle komputery jest w stanie przeanalizować coś takiego jak jakość na czym moglibyśmy zacząć tak przewrotnego pytania czy ludzie potrafią ocenić jakość imprez, choć pewnie, że tak oczywiście jest od 3 oceny jakości zawsze staramy się to w jakim sensie przyp rozbić takie pewne czynniki, jeżeli spojrzymy NATO, które artykuły są wiercenia jako najwyższej jakości są przypadki języka polskiego taki specjalny artykuł wyróżnionej szkoły na medal mamy dosyć jasno opisane, czego oczekujemy takich artykułów przede wszystkim pani być napisana odpowiednim językiem czy poprawne bez błędów i testy to językiem neutralnym VAT przechodzi taki język, który nie będzie zawierał specjalnych zbędnych ozdobników dodatkowo, jeżeli chodzi o sam opis tego co tam miejsc powinno to być takie skazane opis wyczerpujący trasach możemy przełożyć na to co komputery są w stanie zrobić coś możemy również podzielić sobie to na pewno tak jest wymiary jakości nazywane im przede wszystkim skupiam się na takich wymiarach jak kompletność aktualność oraz wiarygodność tej informacji jeśli chodzi o kompletność, zwłaszcza od mówimy o tym, wyczerpującym, a wyczerpującym opisie tego co tam jest zazwyczaj tego co udało nam się znaleźć artykuły teraz są wysokiej jakości co znaczy tak oceniane przez redaktorów redaktorki one mają dłuższy tekst, więc obrazków więcej struktury zaznaczył również różne nagłówków jeśli chodzi o aktualność dopóty możemy ocenić poprzez analizę zmian w Wikipedii w oczy historia zmian, jeżeli takich wydarzeniach takich wybory można obserwować potem właśnie szybkie na wkład miasta, które się zmieniają prezydenci mają te informacje zaktualizowane dla nas równie ważna jest wiarygodność wiarygodność jej w jaki sposób potwierdzone fakty z Wikipedii znajdują i to z informacją, jakie to były źródła pierwotne, jaki to był ich źródła pierwotne te również w jaki sposób Sejm można do literatury się odnieść na test to co w zasadzie ranczu one też maszynowo wzorować no właśnie to jest ciekawe w jaki sposób przypisać później kryteria na język komputera o coś wykorzystujemy coś co się nazywa do tego uczenie maszynowe polega na tym, że przedstawione pewne wzorce i komputery powinny się na podstawie wzorców nauczyć to co znaczy coś przewoźnicy i artykuł, który jest przez wikipedystów oceniony bardzo wysoko opisujemy go różnymi wskaźnikami o tym, że to zachwiać piętra mówimy, że jeżeli są takie wskaźniki to też dobry artykuł taki test bardzo dobry, a jeżeli jakiś inny wskaźnik bezrobocia słabiej teraz uczenie maszynowe polega na tym, że komputery stają się właśnie wychwycić, które tych wskaźników mówią o tym, który to artykuł powinny być właśnie wysoko oceniany teraz nasze badanie właśnie wskazanie tych wskaźników, które będą do tego służyły teraz takie tango wskaźnik napięć stos Unia właśnie ta wielkość artykuł na miarę objętościowych czy ma odpowiednią liczbę znaków czepek Knowledge jakiś tam struktury obrazków i t d. również ta sama struktura artykułu mogą być też kary stosowane takie trochę bardziej zaawansowane wskaźniki jakościowe jak n p. indeks czytelności czy można wyznaczyć na podstawie używanych słów czy taki artykuł jest zrozumiały dla wszystkich na świat wymaga znajomości jakiś inny bardziej skomplikowanych terminów mamy też coś takiego jak referencje w artykule, więc również badamy ile tych preferencji jest test czeka również jest ważna między nimi prace powiązań art. 15 czyta artykuły są cytowane liczne poprzez inne artykuły takie są zazwyczaj w nauce bywa artykuły trafią wysoko oceniane są często cytowanej przez, toteż możemy wskazać, iż właśnie trzeci maszyny generalnie patrząc na te różne wskaźniki mogą starać się ocenić jakość tych artykułów, ale czy państwo zamierzają zbadać całą Wikipedii trzymają ściągnąć na deski jak się w ogóle do tego zabrać tak to znaczy są dostępne tzw. zrzuty TV medyczny można ściągnąć całą zawartość Wikipedii i analizować co lokalnie tak w paczce algorytmy, które są one faktyczną wymagają dosyć intensywna dostępu do tych danych, więc mamy różne wersje językowe, które chcemy przeanalizować i poszczą dane o rozsądny nawet nie tylko strony, ale również istotne są dyskusje o stronach oraz również historia zmian wszystkich stron ile języków ma być badanych w tej chwili pracujemy naszego języka, który jest między polskiej niemieckiej angielskiej francuskiej nie jest jeszcze ze Słowiańskiej z rosyjskich ukraińskich i białoruski to co ten projekt da to znaczy do czego mogą się przydać zebrane dane analizy przede wszystkim do tego tak naszym celem centrum miasta poprawa tej jakości Wikipedii w akcie tym przypadku wykorzystujemy też może być, tak więc powtarzać tych języków jest tyle test nieprzypadkowo wynika to z tego, że każdy z tych wędkarze bez językowych jest tworzona niezależnie i są różne uwarunkowania kulturowe n p. może to różnie wygląda w przypadku różnych języków, a są niezależni twórcy, którzy w ramach swoich między pod koniec wojny, lecz obie opisują to i teraz mamy produkty Global to o 17 badamy jak wyglądają opisy filmów albumów muzycznych komputerów telefonów samochodów, czyli to jest coś jest produktem globalnym znanym każdemu każdy opcje na swój sposób i teraz w różnych wersjach językowych są różne osoby, które się przykładają w różny sposób tych opisów jesteśmy w stanie teraz zebrać wszystkie artykuły z różnych wersji językowych i zastawiony Bartosika pod Osterwą operatów tak nas tutaj mamy cię to powtarzające się daną wartość zamówienia to pewnie to wartość poprawna innymi wykonawcami mamy inną datę aktualizacji stąd ta nowsza wersja może być aż tak lepsza właśnie na tej podstawie staramy się to szybko, zostawiając powiedzieć, które z tych wartości mogą być najlepsi pięściarze ten właśnie ta poprawa w samej jakości w Wikipedii, ale to, że te artykuły będą poprawiane tylko serwetek patos koi 1 1 10 8 Italia na woli o natomiast istotne jest również to, że możemy zaproponować nowe metody oceny jakości, które mogą mieć zastosowanie ma 40 w aspektach biznesowych Bartosza to co teraz jest tak zjawiskiem bez outsourcing tzw . znaczy, że to społeczność tak naprawdę dostarcza informacji na różne sposoby tradycji itd itp, a najbardziej znamienitym przykładem natomiast mamy szansę, iż fora dyskusyjne czy te są tworzone mapy takich opłat Street map w postaci właśnie wkładu społeczności po namyśle dowiedzieć się może upaść Danuta wprowadzone, jeżeli są one i zafałszowania stąd tak w Rawie umieć wskazać miejsca, gdzie należałoby się jak poprawić dostarcza również metody, które mogą mieć zastosowanie w biznesie również firmy n p. jeśli wskutek ogłoszenia internetowe czy pyszne wiadomości internetowe też tacy w obrazie to metody trafiło ocenić na ile ta wiadomość jest poprawna czy wiary, bo czy to mogłoby być narzędzie do automatycznego zwalczania AIDS newsów, które tak jak w sensie tak, jeżeli spojrzymy na to co może przez pan trochę będzie łatwiej toporną pokaże jak gość macie Stelmach prezes pan też to też można wychwycić pewne cechy charakterystyczne spamu, czyli użycie pewnych słów, a użycie pewnych adresów internetowych może to być jakiś tam specyficzne znaczki jak może na podstawie treści wobec obu jego zawartości lub takich związków między tymi innymi elementami wartość i to jest pan w przypadku Faith no może zadziałać podobnie sprawa trochę trudniejsza, bo tak naprawdę to nie jest coś co jak jest oczywiste Aero 2 i po co oczywiste takie zafałszowania natomiast, jeżeli potrafimy wyciąć elementy składowe wiadomości i możemy pozostawić czym chce taką wiedzą o Lwowie w poprawnej, czyli dopłat Wikipedia powinna być traktowana to może być objęte są też wiadomość żona jest niezgodna z prawdą, bo tam się pewne fakty nie zgadzają to by było bardzo interesujące szczerze mówiąc, żeby mieć taką nakładkę na przeglądarkę internetową, która wyrasta najbliższy czas na regałach na czerwono, że to co czytasz to nie jest prawda w nie jest to na pewno duże wyzwanie, ale z tym wyzwaniem też tak naprawdę muszą się zmierzyć również najwięksi dostawcy także i ci, którzy tymi mediami społecznościowymi chorują to jest niewątpliwie wyzwanie na najbliższe lata proszę jeszcze powiedzieć o państwa projekcie to kiedy on powinien zostać zakończone, kiedy wyniki te wyniki różne pojawiały się na bieżąco jest projekt jeszcze trochę to by teraz na nasze wyniki te przedstawiane są przedstawiane w różnych publikacjach natomiast, jeżeli chodzi oto ten konkretny ekran z Microsoftu ma to przez wakacje planujemy intensywnie pracować dalej mam nadzieję, że po wakacjach jeszcze ciekawsze wyniki będzie można przedstawić to przede wszystkim chcemy zrobić to właśnie przeanalizować większą liczbę języków Brenna i zobaczyć jak faktycznie ta infrastruktura do tych budowa będzie mogła przyspieszyć czy też zwiększyć obecność naszych analiz bardzo dziękuję pan dr Krzysztof Wencel Uniwersytetu ekonomicznego w Poznaniu dziękuję panie doktorze bardzo dziękuję włączyliśmy się przez Skype jest ósma 1 5 słuchają państwo Radia TOK FM za chwilę skrót informacji pod skórę z informacji na temat lektury jest zasmucająca powiemy o Jemenie epidemii cholery w tym kraju i nieustająco trwającej wojnie Zwiń «

PODCASTY AUDYCJI: PORANEK RADIA TOK FM - WEEKEND - KAROLINA GŁOWACKA

Więcej podcastów tej audycji

REKLAMA

POPULARNE

REKLAMA

DOSTĘP PREMIUM

Podcasty TOK FM oraz radio TOK+Muzyka bez reklam - teraz 40% taniej w zimowej promocji!

KUP TERAZ

SERWIS INFORMACYJNY

REKLAMA
REKLAMA
REKLAMA