Dobrze napisane, unikatowe opisy produktów są niezbędne w każdym sklepie internetowym.

Obecne algorytmy indeksujące strony internetowe zwracają uwagę przede wszystkim na treści tekstowe. Najwyżej oceniane są strony WWW posiadające rozbudowane i unikatowe opisy. Im więcej słów charakteryzujących dany produkt zawiera jego opis, tym większe jest prawdopodobieństwo wyszukania stron z tym produktem.

Treściwy i precyzyjny opis jest ważny również na etapie podejmowania decyzji przez potencjalnego klienta. Może on zachęcić do zakupu i utwierdzić klienta w decyzji, że to co widzi na zdjęciu jest faktycznie tym, czego oczekuje. Niestety tworzenie zróżnicowanych opisów jest trudne dla małych zespołów (człowiek podświadomie pisze schematycznie), kosztowne przy większych zespołach i narażone na błędy merytoryczne przy zlecaniu tego zadania na zewnątrz. Dodatkowo, duże znaczenie ma czas tworzenia takiego opisu. Codziennie do katalogów sklepów dodawane są nowe produkty i wymagają one jak najszybszego stworzenia treści opisowych. Wyzwaniem technologicznym jest automatyczne generowanie pełnotekstowego, gramatycznie poprawnego opisu produktu na podstawie jego zdjęcia.

Automatyczne generowanie opisu na podstawie zdjęcia wymaga zastosowania dwóch obszarów sztucznej inteligencji – przetwarzania obrazów i przetwarzania języka naturalnego. Głównym wyzwaniem jest znalezienie sposobu na połączenie graficznej (zdjęcie) i tekstowej (opis) prezentacji produktu w jednym spójnym modelu, który można zastosować do całej gamy produktów.

Do rozwiązania tego problemu używamy najnowszych osiągnięć w tej dziedzinie. Najnowsze metody oparte są o modele generatywne zbudowane na bazie sieci neuronowych. Używamy architektury enkoder-dekoder łączącej konwolucyjne sieci neuronowe i rekurencyjne sieci neuronowe. Takie podejście pozwala na stworzenie systemu, który bezpośrednio mapuje zdjęcia na zdania w języku naturalnym.

Skontaktuj się z nami aby dowiedzieć się więcej o tym projekcie.