Informatie

Word frame ontwerp landschap

Word frame ontwerp landschap



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Ontwerplandschap voor woordframes met analyse van afgeleide semantische frames in op gebruik gebaseerde modellen (U/UW/UAI 2020). Dit is het eerste bericht van de auteur op deze blog en dus een beschrijving van de resultaten van dit artikel. De onderzoeksdoelen zijn om te onderzoeken welke semantische frames voorkomen in de op gebruik gebaseerde modellen, wat deze framelabels betekenen en wat kan worden afgeleid over de semantische frames.

Hoeveel modellen heb je? Wat zijn de modellen? Welke semantische frames beschrijven ze? Welke zijn de primaire frames?

Op basis van mijn onderzoek naar Usage-Based NLP Frameworks [1] en Metaforen in Usage-Based NLP Frameworks [2], heb ik de volgende framing gekozen:

de gereedschapskist

Laten we, voordat ik in de semantiek duik, eens kijken naar de op gebruik gebaseerde modellen zelf. Ik heb 10 methoden en de bijbehorende codevoorbeelden uit die papieren geïdentificeerd. De code voor elk van de methoden is niet voldoende om de semantische frames af te leiden, dus ik heb daarvoor geen code in mijn onderzoek opgenomen. Als je geïnteresseerd bent in code, kun je hier een deel van het onderzoek vinden [3].

De methoden die ik heb gekozen om te bestuderen zijn:

AutoAkkoord

AutoAgree gebruikt de gouden standaard van een semantisch frame genaamd Semantische gelijkenis, wat een aanpassing is van de cosinusovereenkomstscore (POSNOUN-SCORE) van WordNet aan sentimentanalyse [4]. Deze benadering evalueert de overeenkomst tussen woorden in een sentimentzin en bepaalt het argumentframe voor een sentimentuitdrukking. U kunt meer lezen over het probleemdomein in dit artikel [3].

De code van AutoAgree bevat 2 regels: GetArgFrame(Sentence) en GetAgreement(Sentence, Interval).

GetArgFrame(Sentence) herhaalt een zin op zoek naar woorden, wat de aanwezigheid van een argument aangeeft. Het retourneert het meest voorkomende argument dat een zelfstandig naamwoord is.

GetAgreement(Zin, Interval) retourneert een semantisch gewogen overeenkomst met gewichten die zijn ingesteld voor de overeenkomstscore, de inverse kans op de overeenkomst en de inverse kans op de onenigheid. De overeenkomstgewichten zijn gebaseerd op de waarschijnlijkheid van overeenstemming in het NLTK-corpus, met een voorwaardelijke waarschijnlijkheid van overeenstemming volgens het type token zoals gedefinieerd in AutoAgree:

p(Akkoord) = r*p(Neg) + 1 - r

NegatieveOvereenstemming = p(Niet mee eens)

p(Niet mee eens) = p(Concorde)

p(Concorde) = n*p(Agent) + m*p(Opinie) + p(Persoon)

p(Agent) = k/3

p(mening) = k/3

p(persoon) = n/(2*k)

n = 1,0

m = 1,0

r = 0,75

k = 0,6

In de implementatie van AutoAgree worden alle zelfstandige naamwoorden geëvalueerd als argumenten. Als alle zelfstandige naamwoorden een waarschijnlijkheid van overeenstemming onder een drempel hebben, wordt de kans op de onenigheid vergroot:

kans op onenigheid = p(oneens) * p(negatieve overeenkomst)

p(Niet mee eens) * p(NegatieveOvereenkomst) = p(NegatieveOvereenkomst) * 0.7

Uit het artikel blijkt dat de kans op overeenstemming wordt berekend uit twee bronnen: 1) de woordenschat van het corpus en 2) een subset van woordparen die zijn toegewezen aan de POS-categorie van zelfstandig naamwoord en een gevoel betekenen, en een gewicht hebben van p (Niet mee eens). De meeste gangbare POS-paren krijgen het gewicht van het sentiment in het corpus, behalve de nominale en verbale zelfstandige naamwoorden, die een gewicht krijgen van p (Niet mee eens):

p(niet mee eens) = p(werkwoord) + 1 - p(zelfstandig naamwoord)

Figuur 1 in de paper toont het algoritme voor de waarschijnlijkheid van overeenstemming. De grafiek toont de weging van woordenschat en domeinweging (met behulp van de NLTK-kansverdeling) versus een cumulatieve verdeling van overeenstemming gewogen voor p(negatieve overeenkomst). De grafiek laat zien dat de weging van de woordenschat verschuift naar een gewogen woordenschat.

Het codevoorbeeld van AutoAgree bevat ook de volgende zin: "Tevreden klanten zouden deze locatie als een uitstekende pizzeria beschouwen"

arg = GetArgFrame (zin)

zin = WordNet.getSynsetForLabel(arg)

zin = zin.lprops[WordNet.LPROPS.LARG]

Voor het bovenstaande codefragment is arg het toegewezen argument-zelfstandig naamwoord voor de "happy" in de eerste zin, "review" is het werkwoord in de tweede zin en de derde zin bevat een ontkenning om het sentiment aan te geven. Zin "tevreden klanten" heeft een semantisch label van "PERSOON". Zin "zou deze locatie beoordelen" heeft een semantisch label van "AGENT", "locatie" is een bepaling, "dit" is een voornaamwoord en "review" is een werkwoord. Daarom gebruikt de zin "tevreden klanten zouden deze locatie als een uitstekende pizzeria beoordelen" "uitstekende pizzeria" als argument voor "gelukkig".

Waar wordt dit semantische frame precies voor gebruikt? Laten we, om dit te onderzoeken, eens kijken naar op gebruik gebaseerde methoden die zijn gebaseerd op AutoAgree.

Welke kenmerken?

De oplossing van AutoAgree voor het "gelukkige" argument is om automatisch het zelfstandig naamwoord te selecteren met de hoogste cosinus-overeenkomstscore met het "gelukkige" in een zin. De functietabel voor AutoAgree[3] toont “review”, “location”, “this”, “excellent” en “pizza”. Elke kolom komt overeen met een primair frame dat wordt beschreven door het juiste semantische frame in een op gebruik gebaseerd model. De kolommen vertegenwoordigen de semantische frames die in een specifiek model worden waargenomen. De lege cellen


Bekijk de video: Landscape Design. 75 ideas for inspiration. (Augustus 2022).