Reporter 中的實驗名稱
PETsARD 採用統一的實驗命名規範,用於識別和追蹤實驗過程。本文件說明兩種主要的命名格式及其使用方式。
實驗名稱格式
實驗元組
full_expt_tuple
是一個由模組名稱和實驗名稱組成的元組:
(module_name, experiment_name)
此格式主要用於建立報告時指定實驗:
# 基本用法
reporter.create({
('Synthesizer', 'exp1'): df_synthetic,
('Evaluator', 'eval1_[global]'): df_results
})
# 多實驗比較
reporter.create({
('Synthesizer', 'exp1_epsilon0.1'): df_low_privacy,
('Synthesizer', 'exp2_epsilon1.0'): df_high_privacy,
('Synthesizer', 'exp3_epsilon5.0'): df_baseline
})
# 不同評估層級
reporter.create({
('Evaluator', 'eval1_[global]'): global_results,
('Evaluator', 'eval1_[columnwise]'): column_results,
('Evaluator', 'eval1_[pairwise]'): pair_results
})
實驗字串
full_expt_name
是將模組名稱和實驗名稱用連字號串接的字串:
{module_name}-{experiment_name}
此格式用於輸出檔案名稱:
# 合成資料檔案
petsard_Synthesizer-exp1.csv
petsard_Synthesizer-exp2_epsilon1.0.csv
# 評估報告檔案
petsard[Report]_Evaluator-eval1_[global].csv
petsard[Report]_Evaluator-eval1_[columnwise].csv
命名範例
資料合成實驗
# 不同方法比較
reporter.create({
('Synthesizer', 'exp1_ctgan'): ctgan_results,
('Synthesizer', 'exp2_tvae'): tvae_results,
('Synthesizer', 'exp3_copula'): copula_results
})
# 輸出檔案:
# petsard_Synthesizer-exp1_ctgan.csv
# petsard_Synthesizer-exp2_tvae.csv
# petsard_Synthesizer-exp3_copula.csv
隱私參數實驗
# 隱私參數調整
reporter.create({
('Synthesizer', 'exp1_eps0.1_delta1e-5'): low_privacy_df,
('Synthesizer', 'exp2_eps1.0_delta1e-5'): med_privacy_df,
('Synthesizer', 'exp3_eps10.0_delta1e-5'): high_privacy_df
})
# 輸出檔案:
# petsard_Synthesizer-exp1_eps0.1_delta1e-5.csv
# petsard_Synthesizer-exp2_eps1.0_delta1e-5.csv
# petsard_Synthesizer-exp3_eps10.0_delta1e-5.csv
評估實驗
# 多層級評估
reporter.create({
('Evaluator', 'privacy_risk_[global]'): global_privacy,
('Evaluator', 'data_quality_[columnwise]'): column_quality,
('Evaluator', 'correlation_[pairwise]'): pair_correlation
})
# 輸出檔案:
# petsard[Report]_Evaluator-privacy_risk_[global].csv
# petsard[Report]_Evaluator-data_quality_[columnwise].csv
# petsard[Report]_Evaluator-correlation_[pairwise].csv
命名建議
模組名稱
- 使用標準模組名稱:‘Synthesizer’、‘Evaluator’、‘Processor’ 等
- 注意大小寫需要完全匹配
實驗名稱
- 使用有意義的前綴:’exp’、’eval’、’test’ 等
- 用底線分隔不同部分:方法名稱、參數設定等
- 評估層級使用方括號:[global]、[columnwise]、[pairwise]
參數編碼
- 參數名稱使用縮寫:eps (epsilon)、del (delta) 等
- 數值使用簡潔表示:1e-5、0.1 等
- 多參數用底線連接:eps0.1_del1e-5