1. Объясните мне: на пути к пониманию решений о конфиденциальности (arXiv)

Автор:Гонул Айджи, Пынар Йолум, Арзукан Озгюр, Мурат Шенсой

Аннотация. Помощники по конфиденциальности помогают пользователям управлять своей конфиденциальностью в Интернете. Их задачи могут варьироваться от обнаружения нарушений конфиденциальности до рекомендации действий по обмену контентом, которым пользователь собирается поделиться. Недавняя работа над этими задачами многообещающая и показывает, что помощники по конфиденциальности могут успешно с ними справиться. Однако для использования пользователями таких помощников по конфиденциальности важно, чтобы эти помощники могли объяснять пользователям свои решения. Соответственно, в этой статье разрабатывается методология создания объяснений конфиденциальности. Методология основана на выявлении важных тем в интересующей области, предоставлении схем объяснения решений и их автоматической генерации. Мы применяем предложенную нами методологию к реальному набору данных о конфиденциальности, который содержит изображения, помеченные как частные или общедоступные, для объяснения меток. Мы оцениваем наш подход на основе исследования пользователей, которое показывает, какие факторы влияют на то, чтобы пользователи сочли объяснения полезными.

2. Изучение двусмысленности с помощью последовательных аннотаций толпы (arXiv)

Автор:Сяолэй Лу

Аннотация: большинство методов краудсорсингового обучения рассматривают разногласия между комментаторами как шумные ярлыки, в то время как взаимное разногласие между экспертами часто является хорошим индикатором двусмысленности и неопределенности, присущих естественному языку. В этой статье мы предлагаем структуру под названием Learning Ambiguity from Crowd Sequential Annotations (LA-SCA), чтобы исследовать взаимное несогласие между надежными аннотаторами и эффективно сохранять запутанную информацию о метках. Во-первых, разрабатывается иерархическая байесовская модель, позволяющая делать выводы из толпы и группировать аннотаторов с одинаковой надежностью. Путем моделирования взаимосвязи между размером группы, в которой участвует аннотатор, надежностью аннотатора и однозначностью элемента в каждой последовательности, вычисляется взаимное несогласие между надежными аннотаторами по неоднозначным элементам для получения информации о метках, вводящей в заблуждение, которая включается в стоимость. маркировка чувствительной последовательности. Экспериментальные результаты по тегированию POS и задачам NER показывают, что предложенная нами структура достигает конкурентоспособной производительности при выводе достоверных данных из толпы и прогнозировании неизвестных последовательностей, а интерпретация результатов иерархической кластеризации помогает обнаруживать шаблоны маркировки аннотаторов с аналогичной надежностью.