Konkurs Tech Arena Poland 2023
Huawei zaprosza do udziału w otwartym konkursie organizowanym specjalnie dla studiujących w polskich uczelniach – Tech Arena Poland 2023. Konkurs jest zespołowy i będzie trwał w okresie od 27 października do 8 grudnia 2023 roku. Wyniki konkursu zostaną ogłoszone 16 grudnia 2023 roku. Celem konkursu jest napisanie aplikacji wspierającej multimodalne wyszukiwanie dokumentów. Szczegóły dotyczące konkursu i warunki uczestnictwa dostępne są na stronie https://techarena-poland.hackathon.com/.
WIĘCEJ O WYZWANIU
Termin „multimodalne wyszukiwanie plików” odnosi się do procesu wyszukiwania plików, w którym wykorzystuje się różne metody, takie jak tekst, obraz, dźwięk i wideo, w celu zapewnienia najdokładniejszych wyników. Działa poprzez łączenie i analizowanie różnych typów danych wejściowych, co pozwala na bardziej złożone i wszechstronne zrozumienie kontekstu wyszukiwania.
Na przykład multimodalne wyszukiwanie plików może pozwolić użytkownikowi na przeszukiwanie dokumentów nie tylko na podstawie metadanych tekstowych, takich jak nazwa pliku czy znaczniki, ale także na podstawie zawartości tych plików, np. tekstu zawartego w dokumencie, elementów graficznych w PDF, a nawet dialogi z nagrania audio lub wideo.
Może to znacznie ułatwić odnajdywanie konkretnych plików w dużych zbiorach danych, szczególnie tych, które zawierają różne typy plików.
W tym konkursie skupimy się na zadaniu wyszukiwania multimodalnego opartego na zapytaniach, wykorzystując kombinację modelu obrazu i tekstu.
Biorąc pod uwagę zbiór danych multimodalnych (pary obrazów i opisów tekstowych obrazu) oraz zapytanie wyszukiwania w języku naturalnym, zadaniem jest zaprojektowanie i zaimplementowanie modelu umożliwiającego odkrycie najlepszych obrazów w tej kolekcji, które są istotne dla zapytania.
Obrazy najbardziej odpowiednie dla zapytania są uważane za podstawową prawdę zapytania i oczekuje się, że będą najwyżej oceniane przez uczestniczące modele. Aplikacje wdrażające model powinny działać na samodzielnym komputerze stacjonarnym lub laptopie.
Zawody będą podzielone na 2 fazy – fazę treningową i fazę zawodów finałowych.
Zbiory danych dotyczące obu etapów zostaną udostępnione na stronie internetowej konkursu.
Zbiory danych składają się ze zbioru uczącego, zbioru walidacyjnego i zbioru testującego. Zestaw treningowy i zestaw walidacyjny zostaną udostępnione w fazie szkolenia, a zestaw testowy zostanie ujawniony w fazie końcowej.
Zestaw treningowy
Zestaw szkoleniowy składa się z par zapytań i opisów tekstowych obrazu opartego na rzeczywistości. Te pary próbek można traktować jako pozytywne przykłady do szkolenia modelu wyszukiwania.
Zestaw walidacyjny
Zestaw walidacyjny składa się z wielu zapytań, a zestaw testowy składa się z kolejnych zapytań. Dla każdego zapytania w tych zestawach istnieje pula kandydatów na obrazy ze sparowanym opisem tekstowym i podstawowymi wynikami dla każdego zapytania oceniającego.
Zestaw testowy
Zestaw testowy ma ten sam format co zestaw walidacyjny, ale zostanie ujawniony dopiero w końcowej fazie zawodów, a rzeczywiste wyniki zestawu testowego nie zostaną opublikowane.
Faza 1 - Faza szkolenia
Rozpocznie się natychmiast po rozpoczęciu wyzwania. Na tym etapie uczestnicy muszą opracować aplikację i dostroić algorytmy. Wyniki oceny zestawu walidacyjnego zostaną uszeregowane i wyświetlone na publicznej tablicy wyników na żywo aż do końca fazy.
Każdy uczestniczący zespół może dziennie przesłać maksymalnie 10 zgłoszeń do zestawu walidacyjnego.
Faza 2 – Faza rywalizacji
Odbędzie się ono po fazie szkolenia i będzie ograniczone do 3 dni.
Zespoły wykorzystują opracowane przez siebie aplikacje do wyszukiwania i dostarczania wyników zapytań w zbiorach testowych. Wyniki i ranking na zestawie testowym NIE zostaną podane do końca fazy.
O ostatecznym rankingu decydują wyłącznie wyniki fazy konkursowej.
Nagrodzone zespoły będą zobowiązane do przesłania raportu technicznego zawierającego opis zastosowanych rozwiązań oraz pokazania aplikacji w akcji podczas ceremonii wręczenia nagród.
Gorąco zachęcamy Państwa, w szczególności zainteresowanych zastosowaniami uczenia maszynowego, do udziału w tym konkursie.