evaluation_strategy="epoch" 和 evaluation_strategy="steps" 区别

evaluation_strategy 是 Hugging Face 的 transformers 库中 TrainingArguments 的一个参数，它决定了在训练过程中进行模型评估的频率。主要有以下两种设置：

1. `evaluation_strategy="epoch"`

含义：表示在每个训练周期（epoch）结束时进行一次评估。
适用场景：适合在训练数据量较大时使用，因为每个 epoch 通常会花费较长的时间。这样可以减少评估的频率，节省计算资源。
优点：
- 减少评估次数，节省计算资源。
- 评估间隔较长，适合长时间训练的模型。
缺点：
- 如果一个 epoch 包含大量的训练步骤，评估结果可能会滞后，无法及时反映模型在训练过程中的变化。

2. `evaluation_strategy="steps"`

含义：表示在每隔一定的训练步骤（steps）后进行一次评估。具体的评估频率由 eval_steps 参数决定。
适用场景：适合在训练数据量较小时使用，或者希望更频繁地监控模型性能时使用。
优点：
- 评估更频繁，可以更及时地监控模型性能变化。
- 适合需要快速验证模型效果的场景。
缺点：
- 频繁评估可能会增加计算开销，特别是在训练数据量较大时。

示例代码

使用 `evaluation_strategy="epoch"`

from transformers import TrainingArguments

training_args = TrainingArguments(
    output_dir="./results",
    evaluation_strategy="epoch",
    learning_rate=2e-5,
    per_device_train_batch_size=16,
    per_device_eval_batch_size=16,
    num_train_epochs=3,
    weight_decay=0.01,
)

使用 `evaluation_strategy="steps"`

from transformers import TrainingArguments

training_args = TrainingArguments(
    output_dir="./results",
    evaluation_strategy="steps",
    eval_steps=500,  # 每隔 500 步进行一次评估
    learning_rate=2e-5,
    per_device_train_batch_size=16,
    per_device_eval_batch_size=16,
    num_train_epochs=3,
    weight_decay=0.01,
)

总结

evaluation_strategy="epoch"：每个 epoch 结束时评估一次，适合长时间训练和大数据量。
evaluation_strategy="steps"：每隔一定的训练步骤评估一次，适合需要频繁监控模型性能的小数据量或快速验证场景。

选择哪种策略取决于你的具体需求和计算资源。希望这些信息对你有所帮助！如果你有更多问题，欢迎继续提问。

evaluation_strategy="epoch" 和 evaluation_strategy="steps" 区别

evaluation_strategy="epoch" 和 evaluation_strategy="steps" 区别

1. `evaluation_strategy="epoch"`

2. `evaluation_strategy="steps"`

示例代码

使用 `evaluation_strategy="epoch"`

使用 `evaluation_strategy="steps"`

总结

chinese-roberta-wwm-ext 训练例子

BERT-wwm-ext 除了填词 [MASK]用的还能归纳总结么？

linyupark

Comments | NOTHING

1. evaluation_strategy="epoch"

2. evaluation_strategy="steps"

示例代码

使用 evaluation_strategy="epoch"

使用 evaluation_strategy="steps"

总结

chinese-roberta-wwm-ext 训练例子

BERT-wwm-ext 除了 填词 [MASK]用的还能归纳总结么？

linyupark

Comments | NOTHING

你想搜索什么...

1. `evaluation_strategy="epoch"`

2. `evaluation_strategy="steps"`

使用 `evaluation_strategy="epoch"`

使用 `evaluation_strategy="steps"`

BERT-wwm-ext 除了填词 [MASK]用的还能归纳总结么？