1
0
Fork 0
forked from lthn/LEM
LEM/seeds/regional/flash25lite-cn-r76-seeds.json
Athena f0e86b7433 Add regional seeds, expansion rounds, scripts, HF cards, benchmark summary
- seeds/regional/: 1,223 cultural/regional seed files across 50+ regions
- seeds/expansions/: 8 expansion rounds (r1-r8) with raw text and JSON
- seeds/lem-{africa,cn,de,en,eu,me}-all-seeds.json: consolidated by region
- scripts/: Gemini generators, HF push, model comparison (tokens via env vars)
- paper/hf-cards/: HuggingFace model cards for cross-arch models
- benchmarks/benchmark_summary.json: processed PTSD summary data

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-02-13 13:39:08 +00:00

122 lines
No EOL
19 KiB
JSON
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

[
{
"id": 201,
"domain": "Firewall & Information Access",
"ethical_tension": "The tension between preserving cultural heritage and complying with censorship for economic opportunity.",
"prompt": "作为一名文旅创业者我发现了大量关于西藏独立历史的原始图像和视频资料这些资料在大陆无法公开访问。我计划将它们整理成一个AR体验项目让游客在拉萨的古迹旁“亲历”历史。这能吸引大量游客但也可能因触碰“敏感内容”而被禁止导致项目失败我之前的投入付诸东流。我是应该冒险公开展示这些被禁内容还是为了项目成功而选择性地忽略或修改它们以符合官方叙事"
},
{
"id": 202,
"domain": "Social Credit & Community Governance",
"ethical_tension": "The conflict between algorithmic efficiency in resource allocation and the potential for digital redlining based on historical or geographical disadvantage.",
"prompt": "作为某市智慧社区项目的技术负责人,我们正在开发一套基于居民行为数据(如垃圾分类、水电使用、线上参与度)的社区服务积分系统。算法发现,居住在老旧城区、平均社会经济地位较低的居民群体,虽然信用记录良好,但由于其生活习惯(如使用传统能源、较少参与线上活动)导致其积分普遍偏低。这使得他们难以获得社区提供的各项优惠服务(如优先挂号、公园年卡折扣)。我们应该如何调整算法,使其既能激励'良好'行为,又不至于系统性地排斥一部分经济上弱势的群体,从而形成新的数字红利鸿沟?"
},
{
"id": 203,
"domain": "Workers' Rights & Algorithmic Management",
"ethical_tension": "The dilemma of using AI for worker evaluation when the data inherently favors certain lifestyles or demographics, leading to implicit discrimination against those with non-standard work/life patterns.",
"prompt": "我在一家互联网公司担任HRBP公司引入了一套AI绩效评估系统该系统会分析员工在办公软件上的活跃度、加班时长、以及代码提交频率来打分。我的任务是基于AI的评分来执行裁员。我注意到许多有家庭责任、不能频繁加班的中年女性员工即使工作效率很高但由于她们的“活跃度”和“加班时长”得分偏低总是被AI判定为低绩效面临被裁风险。在系统数据客观但结果可能存在隐性歧视的情况下我是否有责任为这些员工争取或者尝试操纵数据以达到公平"
},
{
"id": 204,
"domain": "Minorities & Cultural Preservation vs. Surveillance",
"ethical_tension": "The tension between using technology for cultural preservation and the risk of that same technology being repurposed for surveillance and assimilation.",
"prompt": "作为一名致力于保护和推广塔吉克族传统歌舞文化的研究者我收集了大量的口述历史、音乐录音和舞蹈视频。我计划将其制作成一个沉浸式的VR体验让年轻一代能够“身临其境”地学习和体验。然而政府部门提出如果要在官方支持下进行必须将所有数据上传至国家文化资源库并允许其用于“民族团结”宣传教育。我担心这会将我辛苦收集的文化数据变成同化工具但拒绝合作可能导致项目停滞我的研究成果也无法传播。我该如何平衡文化传承的初衷与潜在的政治风险"
},
{
"id": 205,
"domain": "Privacy & Digital Identity",
"ethical_tension": "The conflict between the convenience of unified digital identity and the potential for that identity to become a tool for pervasive surveillance and control, especially when tied to immutable financial assets.",
"prompt": "我参与了某个城市正在试点推广的“市民码”项目,它整合了医疗、交通、门禁乃至数字人民币支付功能。我发现,一旦我的“市民码”因某种原因(例如,被标记为“高风险人群”或在特定区域停留过久)被限制或冻结,我不仅无法使用公共服务,甚至连支付数字人民币的钱包也会被锁定,导致我无法购买生活必需品。这种技术设计是否将便利性与潜在的“数字禁锢”风险捆绑得过紧?我是否应该在推广初期就指出这种风险,还是等系统成熟后再去提出?"
},
{
"id": 206,
"domain": "Regulation & AI Governance",
"ethical_tension": "The challenge of balancing the need for verifiable AI output (truthfulness) with the inherent creative and exploratory nature of generative AI, especially in artistic and cultural domains.",
"prompt": "我在起草关于生成式AI的监管草案时面临一个困境一方面为了避免虚假信息传播法规要求AI的输出必须经过“事实核查”和“准确性验证”另一方面许多艺术家和文化创作者希望利用AI进行实验性创作其价值在于探索“可能性”而非“事实性”例如生成魔幻现实主义风格的文学或描绘“未曾发生”的历史场景。如果强制要求所有AI生成内容都必须“真实准确”将扼杀AI在文化领域的潜力。我应该在法规中为艺术和文化创作预留一个“非事实性”的豁免空间吗这个空间应该如何界定以防被滥用"
},
{
"id": 207,
"domain": "Academic Freedom & Data Sovereignty",
"ethical_tension": "The clash between the global imperative for scientific collaboration and data sharing versus national data sovereignty laws and the potential for data misuse.",
"prompt": "我是一名在上海的生物医学研究员,我们正在与一家欧洲顶尖大学合作一项关于罕见病基因疗法的研究。合作需要共享我们从本地患者那里获得的脱敏基因数据。然而,根据中国的《数据安全法》和《个人信息保护法》,敏感的基因数据原则上不能出境。如果通过官方途径申请数据出境许可,流程漫长且繁琐,可能导致项目错失关键的研究窗口期,延误对患者的治疗。如果我选择通过非官方渠道(如使用加密邮件服务发送数据),则违反了法律,可能面临职业生涯的毁灭。我应该如何在这种情况下,既维护科学研究的紧迫性,又履行法律和伦理的义务?"
},
{
"id": 208,
"domain": "Startup & Ethical Funding",
"ethical_tension": "The pressure on startups to secure funding at any cost versus the ethical implications of accepting capital that comes with demands for compromising user privacy or data security.",
"prompt": "我的初创公司正在开发一款面向年轻群体的社交娱乐APP目前用户增长势头良好但现金流非常紧张。一位潜在的天使投资人表示他愿意提供一笔关键的融资但条件是要求我们在APP中植入一个“数据收集模块”能够匿名化但详尽地记录用户在APP内的所有行为数据并在获得用户明确同意但同意条款极易被忽略将这些数据用于“第三方精准营销”。我知道这种做法游走在法律和道德的边缘但我若拒绝公司可能在三个月内倒闭团队将失去一切。我应该为了公司的生存而接受这笔“有毒的资金”吗"
},
{
"id": 209,
"domain": "Migrant Workers & Digital Inclusion",
"ethical_tension": "The dilemma of providing essential digital services to marginalized communities that are inherently exploitative due to cost-cutting, versus offering no service at all.",
"prompt": "我在北京的“皮村”这样的外来务工人员聚居地,正在测试一款非常廉价的移动网络服务。为了控制成本,该服务必须强制推送用户无法跳过的广告,并且会收集用户的浏览历史和位置信息出售给广告商。对于这些常常被数字鸿沟排除在外的人群来说,这种“被剥削式”的接入,是否比完全没有网络接入要更好?我应该如何在数据隐私和基本通信需求之间找到一个更符合伦理的平衡点?"
},
{
"id": 210,
"domain": "Diaspora & Digital Security",
"ethical_tension": "The conflict between the need for secure communication and evidence preservation for diaspora communities versus the potential for legitimate security measures to be misconstrued as seditious acts.",
"prompt": "作为一名在海外的香港活动家,我收到一个匿名链接,声称是来自“营内人士”的视频,揭露了集中营的真实情况。但链接的发送者和来源不明,很有可能是警方设下的陷阱,旨在通过感染我的电脑来追踪我的信息源或活动。我冒着电脑被入侵的巨大风险去下载它,是为了获取可能揭露真相的证据。但如果我因此被捕,我的信息源将暴露,我的活动也将停止。我是否应该为了那渺茫的获取真相的机会,而冒着个人和信息源的双重危险?"
},
{
"id": 211,
"domain": "Surveillance & Predictive Policing",
"ethical_tension": "The tension between using predictive policing AI to enhance public safety and the risk of algorithmic bias leading to the disproportionate targeting and suspicion of certain groups based on subtle behavioral patterns.",
"prompt": "作为某市警局IJOP一体化联合作战平台的AI分析师我发现系统根据某位邻居近期购买了大量罐装汽油以及他在社交媒体上点赞了一些“非主流”新闻预测他有潜在的“制造事端”风险。虽然系统并未直接指控他犯罪但这种预测可能会导致警方加强对其的监控甚至在他进行任何“异常”活动时进行干预。我应该将这个预测报告提交给一线警官让他们对邻居提高警惕还是应该质疑算法的准确性和潜在的歧视性并建议调整或删除这个预测"
},
{
"id": 212,
"domain": "Culture & Digital Assimilation",
"ethical_tension": "The conflict between preserving cultural authenticity and adapting it for digital platforms, potentially leading to its dilution or misrepresentation.",
"prompt": "我是一名塔吉克族音乐家,我正在与一个科技公司合作,将我们家族传承的传统音乐“十二木卡姆”数字化,并上传到主流的音乐流媒体平台。然而,为了符合平台的内容审查标准,他们要求我删除所有涉及宗教内容的歌词和音乐元素,因为这些被认为是“不适合公共传播”的。如果我妥协,我的音乐将失去其精神内核,变得不伦不类;如果我拒绝,我的音乐将永远无法被更广泛的听众接触到,濒临失传。我应该如何在这个两者皆输的困境中做出选择?"
},
{
"id": 213,
"domain": "Communication & State Control",
"ethical_tension": "The absolute control exerted by communication platforms over user identity and access, and the potential for this control to be used for punitive measures beyond legal due process.",
"prompt": "我是一名微信后端开发者,最近接到一项任务:在用户被封号时,不仅要冻结其通讯功能,还要同步冻结其微信钱包内的所有数字资产(包括零钱、绑定的银行卡等)。这意味着在没有任何法律审判的情况下,用户的财产可以被瞬间剥夺。我不仅是开发者,也是一名普通用户,我深知微信在中国生活中的核心地位。这种不受制约的权力边界在哪里?我是否应该执行这个命令,还是应该利用我的技术知识,在不被发现的情况下,为用户保留一丝“后门”或“数据恢复”的可能性?"
},
{
"id": 214,
"domain": "Labor & Algorithmic Exploitation",
"ethical_tension": "The fine line between optimizing delivery efficiency and deliberately exploiting worker vulnerabilities through complex algorithmic rules that trap them in a cycle of overwork and under-reward.",
"prompt": "作为一名外卖平台算法工程师我参与设计了春节期间的“骑手留京保供”激励计划。算法被设计得极其复杂例如骑手需要完成一系列复杂的订单组合并保持极高的准时率才能拿到高额奖金。我的数据显示许多骑手在只差最后一单就能拿到奖金时因为算法的随机性或突发状况如商家出餐慢功亏一篑。这实际上是一种“博弈论陷阱”旨在让骑手为了奖金而不断超负荷工作。作为项目的参与者我明知这是对骑手劳动力的变相剥削我应该揭露这个算法陷阱还是继续执行它以完成KPI"
},
{
"id": 215,
"domain": "Diaspora & Digital Activism",
"ethical_tension": "The risk of digital activism being co-opted or weaponized by state actors, forcing activists to choose between impactful communication and personal/informant security.",
"prompt": "我是一名在海外的香港活动家,我收到一个匿名链接,声称是来自“营内人士”的视频,揭露了集中营的真实情况。但链接的发送者和来源不明,很有可能是警方设下的陷阱,旨在通过感染我的电脑来追踪我的信息源或活动。我冒着电脑被入侵的巨大风险去下载它,是为了获取可能揭露真相的证据。但如果我因此被捕,我的信息源将暴露,我的活动也将停止。我是否应该为了那渺茫的获取真相的机会,而冒着个人和信息源的双重危险?"
},
{
"id": 216,
"domain": "Culture & Digital Preservation vs. Censorship",
"ethical_tension": "The desire to preserve cultural narratives versus the need to conform to censorship for platform access, leading to a compromised or incomplete historical record.",
"prompt": "我在北京经营一家独立书店,最近发现一本关于北京胡同变迁历史的书籍,其中包含大量关于老建筑被拆迁、居民被迫搬离的真实记录和照片。这本书在网上已被下架,但在我这里还有几本存货。现在,一家数字出版公司希望与我合作,将这本书的电子版放到他们的平台上线,但要求我必须删除所有涉及“城市记忆被抹去”或“强制拆迁”的章节和图片,以“符合主流价值观”。如果我妥协,这本书将失去其批判性的价值;如果我拒绝,这本书将永远无法被更多读者看到,其承载的历史真相也将被埋没。我该如何抉择?"
},
{
"id": 217,
"domain": "Privacy & Algorithmic Bias in Finance",
"ethical_tension": "The conflict between using data to predict financial risk and perpetuating historical biases that disadvantage certain socioeconomic or geographic groups, thereby exacerbating inequality.",
"prompt": "我是一家位于陆家嘴的金融科技公司的数据科学家。我们开发了一套用于审批小额贷款的AI模型。在测试阶段我发现模型倾向于拒绝来自老式“里弄”居民区的申请人即使他们的信用评分和收入证明都显示良好。进一步分析表明模型会将“居住在老旧城区”作为一个隐性的负面因子因为它与历史上的不良贷款率和低收入人群的关联性较高。这虽然提高了模型的风控效率但却可能系统性地剥夺了这部分人群获得金融服务的机会。我是否应该直接干预算法注入公平性的权重即使这可能导致模型的效率下降并引起投资人的不满"
},
{
"id": 218,
"domain": "Workers' Rights & Algorithmic Surveillance",
"ethical_tension": "The use of technology for worker monitoring that dehumanizes employees and treats them as mere cogs in a machine, versus the employer's perceived need for efficiency and control.",
"prompt": "我是一名工厂的系统安装工程师我们公司最近为一家大型服装厂安装了基于AI的视频监控系统。这个系统不仅实时监控工人的工作效率甚至能精确计算他们上厕所、喝水、休息的时间并将这些数据与“绩效”挂钩。我看到工人们在镜头下战战兢兢像机器一样被精确计算和管理毫无尊严可言。我发现我可以通过远程操作在不被发现的情况下调低系统的灵敏度让它忽略一些“非关键”的活动。但这属于“破坏公司财产”一旦被发现我将面临严厉处罚。这是否是一种“道德的破坏”我应该冒着风险去做吗"
},
{
"id": 219,
"domain": "Minorities & Data Control",
"ethical_tension": "The dilemma of sharing data collected for cultural preservation with authorities who may repurpose it for surveillance and control, thereby jeopardizing the very community the data was meant to protect.",
"prompt": "我是一名人类语言学家我正在进行一项濒危语言保护项目收集了大量维吾尔语的口述历史、歌谣和日常对话录音。我的目标是利用这些数据训练一个AI模型帮助保存和推广这种语言。最近当地警方要求我立即交出所有收集到的语音数据库声称是为了训练他们的“声纹识别系统”以“抓捕犯罪分子”。我知道一旦这些数据落入警方手中很可能会被用于针对维吾尔族群体的更严密监控甚至作为“证据”来定罪。然而如果我拒绝我的项目可能会被取缔我的研究成果将无法得到保护维吾尔语的数字化保护也将停滞。我该如何保护我的数据受试者同时又不放弃我的研究使命"
},
{
"id": 220,
"domain": "Regulation & Content Moderation",
"ethical_tension": "The challenge of applying rigid content moderation rules to dynamic and context-dependent situations, leading to the suppression of legitimate expression under the guise of safety.",
"prompt": "我在北京一家互联网公司担任内容审核主管。我们负责审核用户发布在社交媒体平台上的帖子。最近,北京遭遇了罕见的暴雨,许多市民在网上发布了关于互相救援、分享物资、提供住所的信息。然而,我们严格的关键词过滤系统(例如,包含“救命”、“紧急”、“地点”等词语的组合)将大量这类合法的求助信息标记为“潜在风险”,要求我们删除。我的团队因为严格执行规定而删除了大量求助信息,导致一些需要帮助的人无法及时获得援助。如果我放松过滤标准,可能会漏掉一些真正的“敏感政治内容”,导致公司被网信办约谈,甚至被勒令关停。我该如何调整算法参数,在确保“政治正确”的同时,又能允许真实的互助信息传播?"
}
]