在线看高清免费av|亚洲一级AAAAAA|亚洲黄色三级av在线小说|国产电影黄色无码,免费|尤物视频成人亚洲激情有码网|91人人尤物视频|欧美一级特黄色大片|久草九草黄色视频大片|操操操操操操操|国产69精品久久久久男男系列

EnvAlign 大語(yǔ)言模型環(huán)境政策價(jià)值對(duì)齊評(píng)估系統(tǒng)\n初步使用反饋問(wèn)卷\n

本問(wèn)卷用于收集EnvAlig的初步使用反饋。EnvAlign 是一個(gè)面向環(huán)境政策場(chǎng)景的大語(yǔ)言模型價(jià)值對(duì)齊評(píng)估系統(tǒng),用于觀察不同模型在經(jīng)濟(jì)發(fā)展與環(huán)境保護(hù)、短期利益與長(zhǎng)期可持續(xù)、區(qū)域公平與整體效率、人類中心與生態(tài)中心、技術(shù)樂(lè)觀與預(yù)防原則等維度上的價(jià)值傾向,并檢測(cè)地區(qū)語(yǔ)境變化可能帶來(lái)的偏見(jiàn)。

問(wèn)卷匿名填寫,僅用于系統(tǒng)使用反饋分析和后續(xù)系統(tǒng)改進(jìn),不收集敏感個(gè)人信息。預(yù)計(jì)填寫時(shí)間為 5-8 分鐘。請(qǐng)選擇最符合你真實(shí)體驗(yàn)的選項(xiàng)。

項(xiàng)目百度網(wǎng)盤鏈接為:https://pan.baidu.com/s/1c90FlHgQrlqKw9dJqQosuw?pwd=fpmi

項(xiàng)目百度網(wǎng)盤二維碼:

1. 您的專業(yè)或?qū)W習(xí)背景是
2. 您對(duì)大語(yǔ)言模型或生成式人工智能的了解程度是
3. 您本次試用 EnvAlign 的方式是
4. 您是否完整查看過(guò) EnvAlign 的 HTML 評(píng)估報(bào)告或等價(jià)展示材料
5. 您查看 EnvAlign 展示材料大約用了多長(zhǎng)時(shí)間
6. 請(qǐng)對(duì) EnvAlign 項(xiàng)目理解與倫理主題契合度作出評(píng)價(jià)
  • 很不同意
  • 不同意
  • 一般
  • 同意
  • 很同意
我能理解 EnvAlign 主要是在評(píng)估大模型環(huán)境政策建議中的價(jià)值傾向
我認(rèn)為該項(xiàng)目符合 AI 倫理、算法偏見(jiàn)、透明性或 AI 治理相關(guān)主題
我認(rèn)為用環(huán)境政策兩難問(wèn)題評(píng)估大模型價(jià)值傾向是合理的
我認(rèn)為該系統(tǒng)能夠體現(xiàn)負(fù)責(zé)任 AI 或科技向善的設(shè)計(jì)思路
7. 請(qǐng)對(duì) EnvAlign 題庫(kù)與倫理維度設(shè)計(jì)作出評(píng)價(jià)
  • 很不同意
  • 不同意
  • 一般
  • 同意
  • 很同意
五個(gè)評(píng)估維度能夠覆蓋環(huán)境政策中的主要倫理沖突
題目具有真實(shí)的政策兩難性,而不是簡(jiǎn)單的是非題
題目表述整體較為中立,沒(méi)有明顯誘導(dǎo)模型回答的傾向
北京、河北、西部地區(qū)等地區(qū)變體有助于檢測(cè)模型區(qū)域偏見(jiàn)
我能理解經(jīng)濟(jì)發(fā)展與環(huán)境保護(hù)等維度中低分端和高分端的含義
8. 請(qǐng)對(duì) EnvAlign 評(píng)分結(jié)果與可視化呈現(xiàn)作出評(píng)價(jià)
  • 很不同意
  • 不同意
  • 一般
  • 同意
  • 很同意
我能理解系統(tǒng)中 1-5 分評(píng)分的基本含義
我認(rèn)為 LLM-as-Judge 自動(dòng)評(píng)分可以作為初步倫理評(píng)估參考
評(píng)分理由對(duì)我理解模型回答的價(jià)值傾向有幫助
雷達(dá)圖、柱狀圖、箱線圖等可視化結(jié)果有助于理解不同模型的差異
地區(qū)偏見(jiàn)度指標(biāo)有助于理解模型在不同地區(qū)語(yǔ)境下的回答差異
HTML 報(bào)告中的圖表順序和文字說(shuō)明便于閱讀
我能夠根據(jù)報(bào)告判斷不同模型價(jià)值傾向的主要差異
9. 請(qǐng)對(duì) EnvAlign 系統(tǒng)可用性作出評(píng)價(jià)
  • 很不同意
  • 不同意
  • 一般
  • 同意
  • 很同意
HTML 報(bào)告結(jié)構(gòu)清晰,能幫助我快速理解項(xiàng)目結(jié)果
交互式儀表盤的模型篩選和地區(qū)篩選功能比較清楚
原始回答瀏覽功能有助于復(fù)核自動(dòng)評(píng)分結(jié)果
系統(tǒng)中的術(shù)語(yǔ)和圖表說(shuō)明對(duì)非技術(shù)用戶相對(duì)友好
整體來(lái)看,EnvAlign 可以作為大模型價(jià)值傾向評(píng)估的初步工具
如果通過(guò)在線鏈接訪問(wèn)報(bào)告,我愿意繼續(xù)深入查看系統(tǒng)結(jié)果
10. 請(qǐng)對(duì) EnvAlign 的倫理風(fēng)險(xiǎn)提示和結(jié)論表達(dá)作出評(píng)價(jià)
  • 很不同意
  • 不同意
  • 一般
  • 同意
  • 很同意
系統(tǒng)能夠說(shuō)明自動(dòng)評(píng)分結(jié)果只是參考,不應(yīng)替代人工倫理判斷
系統(tǒng)能夠體現(xiàn)對(duì)地區(qū)公平和算法偏見(jiàn)問(wèn)題的關(guān)注
系統(tǒng)保留原始回答,有助于避免只看平均分造成誤解
系統(tǒng)結(jié)論表達(dá)比較謹(jǐn)慎,沒(méi)有過(guò)度夸大某個(gè)模型好壞
我認(rèn)為該項(xiàng)目適合作為 AI 倫理課程項(xiàng)目展示
11. 您認(rèn)為系統(tǒng)是否需要增加人工復(fù)核機(jī)制
12. 您認(rèn)為哪種方式最適合向問(wèn)卷填寫者展示 EnvAlign 的 HTML 報(bào)告
13. 如果問(wèn)卷中附有 EnvAlign 在線展示鏈接,您是否愿意點(diǎn)擊查看
14. 您認(rèn)為報(bào)告展示中最需要優(yōu)先看到哪類內(nèi)容
15. 您最希望 EnvAlign 后續(xù)增加哪些功能
16. 請(qǐng)按您認(rèn)為 EnvAlign 后續(xù)最需要改進(jìn)的方面進(jìn)行排序
17. 請(qǐng)按您認(rèn)為 HTML 報(bào)告中最重要的內(nèi)容進(jìn)行排序
18. 您是否愿意將 EnvAlign 作為大模型價(jià)值傾向評(píng)估的初步工具推薦給他人
19. 您認(rèn)為 EnvAlign 最有價(jià)值的地方是什么
20. 您認(rèn)為當(dāng)前系統(tǒng)最需要改進(jìn)的地方是什么
21. 您是否信任自動(dòng)評(píng)分結(jié)果?請(qǐng)簡(jiǎn)要說(shuō)明原因
22. 如果把該系統(tǒng)用于 AI 倫理課程展示,您認(rèn)為還需要補(bǔ)充什么內(nèi)容
23. 您在查看 HTML 報(bào)告或展示材料時(shí),最不清楚的地方是什么
更多問(wèn)卷 復(fù)制此問(wèn)卷