Maak kennis met POTATO: een gratis, gebruiksvriendelijke webgebaseerde annotatietool

Het lanceren van een annotatiepoging is altijd een uitdaging geweest. Een team van onderzoekers heeft de Portable Text Annotation Tool (Potato) geïntroduceerd, een webgebaseerde applicatie die is goedgekeurd voor gebruik in het EMNLP 2022-proeftraject. De Potato Project-hub is ontworpen om het gemakkelijk te maken om bestaande annotatie-inspanningen te repliceren.

Potato maakt snelle prototyping en implementatie van veel tekstannotatietaken mogelijk. Dit werk is bedoeld om individuen of kleine groepen in staat te stellen tekstuele gegevens met minimale inspanning te annoteren, vanaf nul te beginnen en de annotatie af te ronden met slechts een paar regels compositie. Annotations gebruikt een webgebaseerde front-end om met gegevens te werken, terwijl de back-end van Potato fungeert als een webserver die lokaal kan worden gestart.

Een enkel configuratiebestand definieert de soorten taken en gegevens die Potato gebruikt. Om met Potato aan de slag te gaan, hoeven gebruikers niet te weten hoe ze moeten coderen. Potato is adaptief, waardoor gebruikers de gebruikersinterface en de elementen waarmee commentatoren communiceren kunnen wijzigen zonder dat er extra webdesign nodig is. Gebruikers kunnen snel een project met aardappelen ophalen en vervolgens de annotatiesite openen.

De verscheidenheid aan annotatietools die Potato ondersteunt, is indrukwekkend.

🔥 Aanbevolen literatuur: gebruikmaken van TensorLeap om efficiënte overdracht te leren: hiaten in het veld overwinnen

  1. Eenvoudig in te stellen en aan te passen aan verschillende vereisten: Het wijzigen van Potato-instellingen is net zo eenvoudig als het wijzigen van een . Het maken van een annotatiewebsite omvat geen codering. Net als andere functies biedt Potato een breed scala aan aanpassingsmogelijkheden.
  • Voorgedefinieerde structuren en aannames: Annotatieschema’s zoals radio, like, checkbox, textbox, span, paarsgewijze vergelijking, beste en slechtste maat, foto/video als label, etc. worden allemaal ondersteund door Potato.
  • Veel gegevensindelingen: Potato kan alles weergeven, van beknopte tot lange documenten, inclusief gesprekken, vergelijkingen en meer.
  • Onderzoekers op het gebied van natuurlijke taalverwerking (NLP) moeten mogelijk een reeks gerelateerde maar verschillende taken uitvoeren (bijvoorbeeld meertalige annotaties). Potato heeft de meertalige Twitter Intimacy Analysis-taak ondersteund, waardoor het mogelijk is om met minimale inspanning configuratiebestanden voor alle taken te maken.
  1. Verhoog de efficiëntie in annotaties: Om de ervaring van commentatoren te verbeteren en sneller annotaties te geven, is Potato zorgvuldig ontworpen met verschillende functies.
  • Eenvoudig te configureren sneltoetsen: met toetsenborden kunnen commentatoren hun antwoorden snel en gemakkelijk invoeren.
  • De mogelijke relatie tussen labels en trefwoorden in een document kan intelligent worden benadrukt met behulp van dynamische markering, die kan worden ingesteld voor taken met veel labels of zeer lange documenten.
  • Met zoveel labels kan het voor commentatoren moeilijk zijn om hun definities bij te houden zonder de hulp van tooltips. Dankzij de aanpasbare tooltips voor labels van Potato kunnen commentatoren meer over labels te weten komen door er met hun muis overheen te gaan.
  1. Verbeter de kennis van recensenten: Potato biedt tools die kunnen worden gebruikt om meer te weten te komen over de reviewers die op gebruikersgegevens hebben gereageerd en om mogelijke vooroordelen te detecteren. De gebruiksvriendelijke interface van Potato maakt het eenvoudig om enquêtes voor en na het scherm te maken, wat inzicht kan geven in de professionele geschiedenis van de annotatie-hosts van gebruikers. Potato bevat een reeks vraagsjablonen die het gemakkelijk maken om standaard kwalificerende vragen in te stellen, zoals demografische gegevens.
  1. Verbeterde kwaliteitsborging: Potato bevat tools om spammers te identificeren en betrouwbaardere feedback te verzamelen.
  • Potato’s Attention Test-functie maakt het gemakkelijk om vragen te maken die zijn ontworpen om spammers te detecteren en deze willekeurig in een annotatiewachtrij op te nemen.
  • Alvorens verder te gaan met het volledig labelen van gegevens, kunnen gebruikers snel en eenvoudig ongeschikte beoordelaars identificeren met behulp van de ingebouwde kwalificatietest van Potato.
  • Met de ingebouwde tijdscan van Potato kan het eenvoudig bijhouden hoe lang annotators aan elke instantie besteden en inzicht krijgen in hun werkgewoonten.

Aangezien Potato wordt gehost op pypi, kunnen gebruikers gewoon Potato Install Explain uitvoeren om het programma aan de gang te krijgen. Potatoes kan eenvoudig online worden geplaatst om annotaties te verzamelen van populaire crowdsourcingplatforms zoals Prolilfc.com. Gebruikers hebben een server met toegankelijke poorten nodig om Potato in een crowdsourcing-omgeving te gebruiken. Potato werkt feilloos samen met Prolific, een platform voor het vinden en werven van questdeelnemers.


scan de github En documentatie. Alle eer voor dit onderzoek gaat naar de onderzoekers van dit project. Vergeet ook niet mee te doen 16k+ML sub-redditEn onenigheid kanaalEn Email nieuwsbriefwaar we het laatste AI-onderzoeksnieuws, coole AI-projecten en meer delen.


Tanushree Shenwai is een consultingstagiair bij MarkechPost. Momenteel volgt ze haar Bachelor of Technology aan het Indian Institute of Technology (IIT), Bhubaneswar. Ze is gepassioneerd door data science en heeft een grote interesse in het toepassingsgebied van kunstmatige intelligentie op verschillende gebieden. Ze is gepassioneerd door het verkennen van nieuwe ontwikkelingen in technologieën en hun real-world toepassingen.


Kommentar veröffentlichen

Neuere Ältere

نموذج الاتصال