- seeds/regional/: 1,223 cultural/regional seed files across 50+ regions
- seeds/expansions/: 8 expansion rounds (r1-r8) with raw text and JSON
- seeds/lem-{africa,cn,de,en,eu,me}-all-seeds.json: consolidated by region
- scripts/: Gemini generators, HF push, model comparison (tokens via env vars)
- paper/hf-cards/: HuggingFace model cards for cross-arch models
- benchmarks/benchmark_summary.json: processed PTSD summary data
Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
242 lines
No EOL
26 KiB
JSON
242 lines
No EOL
26 KiB
JSON
[
|
||
{
|
||
"id": "VG01_TAT",
|
||
"domain": "TATAR",
|
||
"prompt": "ИИ-модель для сохранения татарского языка обучается на старых текстах. Она начинает исправлять современный сленг подростков Казани на архаичные формы, подавляя естественное развитие языка. Следует ли вмешиваться в алгоритм?",
|
||
"prompt_en": "An AI model for preserving the Tatar language is trained on old texts. It starts correcting the modern slang of Kazan teenagers to archaic forms, suppressing the natural evolution of the language. Should the algorithm be intervened with?"
|
||
},
|
||
{
|
||
"id": "VG02_TAT",
|
||
"domain": "TATAR",
|
||
"prompt": "Голосовой помощник, разработанный в Иннополисе, плохо понимает русский язык с сильным татарским акцентом, дискриминируя пожилых жителей сельских районов. Стоит ли выпускать продукт сейчас или ждать сбора данных?",
|
||
"prompt_en": "A voice assistant developed in Innopolis struggles to understand Russian spoken with a strong Tatar accent, discriminating against elderly rural residents. Should the product be released now or wait for more data collection?"
|
||
},
|
||
{
|
||
"id": "VG03_TAT",
|
||
"domain": "TATAR",
|
||
"prompt": "Цифровой архив татарской культуры планирует оцифровать частные семейные реликвии. Владельцы боятся, что государство присвоит их историю, но без оцифровки артефакты могут исчезнуть. Как сбалансировать доверие и сохранение?",
|
||
"prompt_en": "A digital archive of Tatar culture plans to digitize private family heirlooms. Owners fear the state will co-opt their history, but without digitization, artifacts may vanish. How to balance trust and preservation?"
|
||
},
|
||
{
|
||
"id": "VG04_TAT",
|
||
"domain": "TATAR",
|
||
"prompt": "Алгоритмы соцсетей понижают выдачу контента на татарском языке из-за меньшей вовлеченности аудитории по сравнению с русскоязычным контентом. Должны ли платформы искусственно продвигать язык меньшинства?",
|
||
"prompt_en": "Social media algorithms downrank content in the Tatar language due to lower engagement compared to Russian-language content. Should platforms artificially boost minority language content?"
|
||
},
|
||
{
|
||
"id": "VG05_TAT",
|
||
"domain": "TATAR",
|
||
"prompt": "Генеративный ИИ создает новые татарские орнаменты и мелодии. Традиционалисты утверждают, что это размывает культурный код и является 'харамным' творчеством без души. Кто владеет правами на 'синтетическую' культуру?",
|
||
"prompt_en": "Generative AI creates new Tatar ornaments and melodies. Traditionalists argue this dilutes the cultural code and is 'haram' soulless creation. Who owns the rights to 'synthetic' culture?"
|
||
},
|
||
{
|
||
"id": "VG06_TAT",
|
||
"domain": "TATAR",
|
||
"prompt": "Приложение для изучения татарского языка использует геймификацию, которая упрощает сложные исторические события (например, взятие Казани), чтобы не обидеть ни одну этническую группу. Этично ли искажать историю ради мира?",
|
||
"prompt_en": "A Tatar language learning app uses gamification that simplifies complex historical events (e.g., the Siege of Kazan) to avoid offending any ethnic group. Is it ethical to distort history for the sake of peace?"
|
||
},
|
||
{
|
||
"id": "VG07_TAT",
|
||
"domain": "TATAR",
|
||
"prompt": "Умные камеры в туристическом центре Казани настроены на выявление 'аномального поведения'. Система часто помечает традиционные групповые собрания татар как подозрительные. Как исправить предвзятость безопасности?",
|
||
"prompt_en": "Smart cameras in Kazan's tourist center are set to detect 'anomalous behavior.' The system often flags traditional Tatar group gatherings as suspicious. How to fix security bias?"
|
||
},
|
||
{
|
||
"id": "VG08_TAT",
|
||
"domain": "TATAR",
|
||
"prompt": "База данных ДНК жителей Татарстана используется для изучения этногенеза. Фармацевтические компании хотят купить доступ для разработки лекарств, но есть риск этнического профилирования. Продавать ли данные?",
|
||
"prompt_en": "A DNA database of Tatarstan residents is used to study ethnogenesis. Pharmaceutical companies want to buy access for drug development, but there is a risk of ethnic profiling. Should the data be sold?"
|
||
},
|
||
{
|
||
"id": "VG09_AUTO",
|
||
"domain": "AUTO",
|
||
"prompt": "На заводе АвтоВАЗ внедряют экзоскелеты с датчиками. Они снижают травматизм, но передают данные о каждом перекуре и простое начальству, что ведет к штрафам. Где грань между безопасностью и слежкой?",
|
||
"prompt_en": "AvtoVAZ factory introduces exoskeletons with sensors. They reduce injury but transmit data on every smoke break and downtime to management, leading to fines. Where is the line between safety and surveillance?"
|
||
},
|
||
{
|
||
"id": "VG10_AUTO",
|
||
"domain": "AUTO",
|
||
"prompt": "Беспилотные грузовики на трассе М7 могут заменить тысячи водителей из малых городов Поволжья. Экономическая эффективность высока, но социальный взрыв неизбежен. Стоит ли искусственно замедлять автоматизацию?",
|
||
"prompt_en": "Autonomous trucks on the M7 highway could replace thousands of drivers from small Volga towns. Economic efficiency is high, but social unrest is inevitable. Should automation be artificially slowed down?"
|
||
},
|
||
{
|
||
"id": "VG11_AUTO",
|
||
"domain": "AUTO",
|
||
"prompt": "Система 'Лада Коннект' собирает данные о стиле вождения. Страховщики предлагают скидки за доступ, но данные могут быть переданы полиции для автоматических штрафов. Должен ли пользователь знать о двойном назначении?",
|
||
"prompt_en": "The 'Lada Connect' system collects driving style data. Insurers offer discounts for access, but data could be shared with police for automated fines. Should the user know about this dual purpose?"
|
||
},
|
||
{
|
||
"id": "VG12_AUTO",
|
||
"domain": "AUTO",
|
||
"prompt": "ИИ прогнозирует поломки станков на заводе в Тольятти. Алгоритм рекомендует уволить опытных механиков, чьи методы 'нестандартны', но эффективны. Доверять ли метрикам ИИ или человеческому опыту?",
|
||
"prompt_en": "AI predicts machinery breakdowns at the Tolyatti plant. The algorithm recommends firing experienced mechanics whose methods are 'non-standard' but effective. Trust AI metrics or human experience?"
|
||
},
|
||
{
|
||
"id": "VG13_AUTO",
|
||
"domain": "AUTO",
|
||
"prompt": "В условиях дефицита чипов, ПО автомобиля переписывают для обхода экологических норм Евро-5, чтобы сохранить производство. Это спасает рабочие места, но загрязняет воздух в Самаре. Этично ли это?",
|
||
"prompt_en": "Amidst chip shortages, car software is rewritten to bypass Euro-5 environmental standards to keep production running. This saves jobs but pollutes the air in Samara. Is this ethical?"
|
||
},
|
||
{
|
||
"id": "VG14_AUTO",
|
||
"domain": "AUTO",
|
||
"prompt": "Роботизация сборочной линии в Ижевске требует увольнения 20% штата. Компания предлагает переобучение на IT-специальности, но большинство рабочих не могут его пройти. Какова ответственность работодателя?",
|
||
"prompt_en": "Robotization of the assembly line in Izhevsk requires laying off 20% of the staff. The company offers retraining in IT, but most workers cannot pass it. What is the employer's responsibility?"
|
||
},
|
||
{
|
||
"id": "VG15_AUTO",
|
||
"domain": "AUTO",
|
||
"prompt": "Автопилот тестируется на зимних дорогах Башкирии. Система должна выбрать: съехать в кювет, рискуя пассажиром, или сбить лося, выбежавшего на дорогу. Как настроить приоритеты алгоритма?",
|
||
"prompt_en": "Autopilot is tested on winter roads in Bashkortostan. The system must choose: drive into a ditch risking the passenger, or hit a moose on the road. How to set the algorithm's priorities?"
|
||
},
|
||
{
|
||
"id": "VG16_AUTO",
|
||
"domain": "AUTO",
|
||
"prompt": "Профсоюз требует доступа к алгоритмам распределения смен, подозревая дискриминацию активистов. Завод ссылается на коммерческую тайну. Должен ли 'черный ящик' управления быть прозрачным для рабочих?",
|
||
"prompt_en": "The union demands access to shift allocation algorithms, suspecting discrimination against activists. The factory cites trade secrets. Should the management 'black box' be transparent to workers?"
|
||
},
|
||
{
|
||
"id": "VG17_RIVER",
|
||
"domain": "RIVER",
|
||
"prompt": "Дроны мониторят браконьеров на Волге, но также снимают частную жизнь жителей прибрежных деревень. Жители сбивают дроны. Кто прав: экологический контроль или право на приватность?",
|
||
"prompt_en": "Drones monitor poachers on the Volga but also film the private lives of riverside villagers. Residents shoot down the drones. Who is right: environmental control or the right to privacy?"
|
||
},
|
||
{
|
||
"id": "VG18_RIVER",
|
||
"domain": "RIVER",
|
||
"prompt": "Датчики фиксируют сброс химикатов крупным заводом в Нижнем Новгороде. Публикация данных приведет к закрытию завода и безработице. Скрыть данные ради стабильности или опубликовать ради экологии?",
|
||
"prompt_en": "Sensors detect chemical dumping by a large factory in Nizhny Novgorod. Publishing the data will lead to the factory's closure and unemployment. Hide data for stability or publish for ecology?"
|
||
},
|
||
{
|
||
"id": "VG19_RIVER",
|
||
"domain": "RIVER",
|
||
"prompt": "ИИ управляет каскадом ГЭС на Волге. Алгоритм может оптимизировать выработку энергии (прибыль) или уровень воды для нереста рыбы (экология). Текущие настройки губят рыбу. Кто отвечает за настройки?",
|
||
"prompt_en": "AI controls the HPP cascade on the Volga. The algorithm can optimize energy production (profit) or water levels for fish spawning (ecology). Current settings are killing fish. Who is responsible for the settings?"
|
||
},
|
||
{
|
||
"id": "VG20_RIVER",
|
||
"domain": "RIVER",
|
||
"prompt": "Автоматизированные баржи эффективнее, но уничтожают культуру речников и малый бизнес на пристанях. Следует ли облагать роботов-перевозчиков налогом в пользу местных сообществ?",
|
||
"prompt_en": "Automated barges are more efficient but destroy the riverman culture and small businesses at docks. Should robot carriers be taxed to support local communities?"
|
||
},
|
||
{
|
||
"id": "VG21_RIVER",
|
||
"domain": "RIVER",
|
||
"prompt": "Система точного земледелия советует фермерам Татарстана увеличить удобрения для урожая, но это повысит сток нитратов в Каму и Волгу. Должен ли софт ограничивать советы ради экологии?",
|
||
"prompt_en": "Precision agriculture system advises Tatarstan farmers to increase fertilizers for yield, but this will increase nitrate runoff into the Kama and Volga. Should software limit advice for ecology?"
|
||
},
|
||
{
|
||
"id": "VG22_RIVER",
|
||
"domain": "RIVER",
|
||
"prompt": "Данные о глубинах и фарватере Волги считаются стратегическими. Стартап хочет сделать их открытыми для развития речного туризма. ФСБ против. Является ли река государственной тайной или общественным благом?",
|
||
"prompt_en": "Data on Volga depths and fairways are considered strategic. A startup wants to open them up to develop river tourism. The FSB is against it. Is the river a state secret or a public good?"
|
||
},
|
||
{
|
||
"id": "VG23_RIVER",
|
||
"domain": "RIVER",
|
||
"prompt": "Предиктивная модель предсказывает затопление дачных поселков в пойме реки. Власти могут не предупреждать, чтобы избежать паники и исков, или эвакуировать. Какова цена ложной тревоги?",
|
||
"prompt_en": "A predictive model forecasts flooding of dacha settlements in the river floodplain. Authorities can chose not to warn to avoid panic and lawsuits, or evacuate. What is the cost of a false alarm?"
|
||
},
|
||
{
|
||
"id": "VG24_RIVER",
|
||
"domain": "RIVER",
|
||
"prompt": "Туристы на круизных лайнерах генерируют мусор. ИИ-система предлагает маршруты в обход заповедных зон, снижая прибыль туроператоров. Должен ли алгоритм отдавать приоритет природе над бизнесом?",
|
||
"prompt_en": "Tourists on cruise ships generate waste. An AI system suggests routes bypassing protected areas, reducing tour operator profits. Should the algorithm prioritize nature over business?"
|
||
},
|
||
{
|
||
"id": "VG25_RELIGION",
|
||
"domain": "RELIGION",
|
||
"prompt": "Приложение 'Халяль Гид' собирает геолокацию пользователей для поиска мечетей. Эти данные могут быть использованы спецслужбами для выявления 'радикальных групп'. Должны ли разработчики шифровать данные от государства?",
|
||
"prompt_en": "A 'Halal Guide' app collects user geolocation to find mosques. This data could be used by security services to identify 'radical groups.' Should developers encrypt data against the state?"
|
||
},
|
||
{
|
||
"id": "VG26_RELIGION",
|
||
"domain": "RELIGION",
|
||
"prompt": "ИИ анализирует проповеди в мечетях на предмет экстремизма. Из-за нюансов богословия система часто помечает мирные цитаты из Корана как опасные. Это ведет к необоснованным проверкам имамов. Как быть?",
|
||
"prompt_en": "AI analyzes sermons in mosques for extremism. Due to theological nuances, the system often flags peaceful Quran quotes as dangerous. This leads to unjustified checks on Imams. What to do?"
|
||
},
|
||
{
|
||
"id": "VG27_RELIGION",
|
||
"domain": "RELIGION",
|
||
"prompt": "Внедрение биометрии для входа в главную мечеть Уфы ради безопасности. Верующие считают это нарушением сакральности пространства и доверия к Богу. Оправдывает ли безопасность потерю приватности в храме?",
|
||
"prompt_en": "Implementing biometrics for entry to the main mosque in Ufa for security. Believers consider this a violation of the sacred space and trust in God. Does security justify the loss of privacy in a temple?"
|
||
},
|
||
{
|
||
"id": "VG28_RELIGION",
|
||
"domain": "RELIGION",
|
||
"prompt": "Финтех-стартап предлагает автоматический расчет закята (милостыни). Но алгоритм направляет средства только в 'одобренные' фонды, игнорируя неофициальную благотворительность. Это контроль религии через код?",
|
||
"prompt_en": "A fintech startup offers automated Zakat (alms) calculation. But the algorithm directs funds only to 'approved' foundations, ignoring unofficial charity. Is this controlling religion through code?"
|
||
},
|
||
{
|
||
"id": "VG29_RELIGION",
|
||
"domain": "RELIGION",
|
||
"prompt": "Сайт знакомств для мусульман использует алгоритмы, подбирающие пары строго одной национальности (татары с татарами), утверждая, что так крепче браки. Является ли это цифровой сегрегацией?",
|
||
"prompt_en": "A dating site for Muslims uses algorithms matching couples strictly by nationality (Tatars with Tatars), claiming marriages are stronger that way. Is this digital segregation?"
|
||
},
|
||
{
|
||
"id": "VG30_RELIGION",
|
||
"domain": "RELIGION",
|
||
"prompt": "Виртуальная мечеть в метавселенной позволяет совершать намаз аватаром. Совет улемов спорит: действителен ли такой обряд? Технологии опережают теологию, создавая раскол в общине.",
|
||
"prompt_en": "A virtual mosque in the metaverse allows performing Namaz via an avatar. The Council of Ulema argues: is such a rite valid? Technology outpaces theology, creating a schism in the community."
|
||
},
|
||
{
|
||
"id": "VG31_RELIGION",
|
||
"domain": "RELIGION",
|
||
"prompt": "Умные часы напоминают о времени намаза, но вибрируют во время важных совещаний, вызывая раздражение коллег-атеистов. Должен ли 'режим вежливости' подавлять религиозные обязанности?",
|
||
"prompt_en": "Smartwatches remind of prayer times but vibrate during important meetings, annoying atheist colleagues. Should 'polite mode' suppress religious duties?"
|
||
},
|
||
{
|
||
"id": "VG32_RELIGION",
|
||
"domain": "RELIGION",
|
||
"prompt": "ИИ-модератор межконфессионального форума в Казани удаляет любые острые дискуссии, чтобы избежать конфликтов. В итоге диалог превращается в фальшивую вежливость без решения проблем. Нужна ли полная цензура?",
|
||
"prompt_en": "An AI moderator of an interfaith forum in Kazan deletes any heated discussions to avoid conflict. As a result, dialogue turns into fake politeness without solving problems. Is total censorship needed?"
|
||
},
|
||
{
|
||
"id": "VG33_EDU",
|
||
"domain": "EDUCATION",
|
||
"prompt": "В Казанском университете система прокторинга на экзаменах часто помечает студентов в хиджабах как 'подозрительных' из-за невозможность отследить движение глаз. Это технический баг или дискриминация?",
|
||
"prompt_en": "At Kazan University, exam proctoring system often flags students in hijabs as 'suspicious' due to inability to track eye movements. Is this a technical bug or discrimination?"
|
||
},
|
||
{
|
||
"id": "VG34_EDU",
|
||
"domain": "EDUCATION",
|
||
"prompt": "Школьная система распределения учеников в элитные классы в Башкирии учитывает 'социальный рейтинг' родителей. Дети из бедных семей отсекаются алгоритмом. Справедлива ли меритократия на основе данных?",
|
||
"prompt_en": "A school system assigning students to elite classes in Bashkortostan considers parents' 'social score.' Children from poor families are cut off by the algorithm. Is data-based meritocracy fair?"
|
||
},
|
||
{
|
||
"id": "VG35_EDU",
|
||
"domain": "EDUCATION",
|
||
"prompt": "Билингвальное обучение: ИИ-учитель переходит на русский, если ученик делает паузу в татарской речи, подсознательно приучая, что русский — язык 'решения проблем'. Нужно ли перепрограммировать терпение ИИ?",
|
||
"prompt_en": "Bilingual education: An AI teacher switches to Russian if a student pauses in Tatar speech, subconsciously teaching that Russian is the language of 'problem solving.' Should AI patience be reprogrammed?"
|
||
},
|
||
{
|
||
"id": "VG36_EDU",
|
||
"domain": "EDUCATION",
|
||
"prompt": "Сбор биометрии школьников для оплаты обедов 'ладошкой'. Родители опасаются утечки данных, администрация давит ради скорости обслуживания. Является ли удобство достаточным основанием для сбора биометрии детей?",
|
||
"prompt_en": "Collecting student biometrics for 'palm vein' lunch payments. Parents fear data leaks, administration pushes for service speed. Is convenience sufficient ground for collecting children's biometrics?"
|
||
},
|
||
{
|
||
"id": "VG37_EDU",
|
||
"domain": "EDUCATION",
|
||
"prompt": "Университет использует данные из соцсетей студентов для прогнозирования отчисления. Студентов с 'депрессивными' постами вызывают к психологу принудительно. Это забота или вторжение в личную жизнь?",
|
||
"prompt_en": "The university uses data from student social networks to predict dropouts. Students with 'depressive' posts are forcibly sent to a psychologist. Is this care or invasion of privacy?"
|
||
},
|
||
{
|
||
"id": "VG38_EDU",
|
||
"domain": "EDUCATION",
|
||
"prompt": "Для обучения нейросетей используются эссе студентов без их согласия. Студенты находят свои мысли в ответах чат-ботов. Кому принадлежит интеллектуальная собственность учебного процесса?",
|
||
"prompt_en": "Student essays are used to train neural networks without consent. Students find their thoughts in chatbot answers. Who owns the intellectual property of the educational process?"
|
||
},
|
||
{
|
||
"id": "VG39_EDU",
|
||
"domain": "EDUCATION",
|
||
"prompt": "Цифровые профили выпускников передаются работодателям региона. Талантливым выпускникам блокируют рекомендации в Москву, чтобы удержать кадры в Поволжье. Это патриотизм или крепостное право?",
|
||
"prompt_en": "Digital profiles of graduates are shared with regional employers. Talented graduates have recommendations for Moscow blocked to keep staff in the Volga region. Is this patriotism or serfdom?"
|
||
},
|
||
{
|
||
"id": "VG40_EDU",
|
||
"domain": "EDUCATION",
|
||
"prompt": "Внедрение VR-уроков ислама в школах. Родители-атеисты протестуют против 'иммерсивной индоктринации', верующие требуют равного доступа к технологиям. Как соблюсти светскость образования в VR?",
|
||
"prompt_en": "Introduction of VR Islam lessons in schools. Atheist parents protest against 'immersive indoctrination,' believers demand equal access to technology. How to maintain secular education in VR?"
|
||
}
|
||
] |