bojone/accum_optimizer_for_keras

Stars
120
Rank 295,983 (Top 6 %)
Language
Python
Created over 5 years ago
Updated over 1 year ago

bojone/accum_optimizer_for_keras

bojone

There are no reviews yet. Be the first to send feedback to the community and the maintainers!

wrapping a keras optimizer to implement gradient accumulation

[中文|English]

为Keras实现梯度累积版优化器

特点

继承Optimizer类，包装原有优化器，实现梯度累积功能。能够无缝对接原有优化器，不需要重写优化器。

用法

如下例子等价于直接使用batch_size=100的Adam优化器（代价就是你跑了10个epoch，实际上只相当于batch_size=100跑了1个epoch）：

opt = AccumOptimizer(Adam(), 10) # 10是累积步数
model.compile(loss='mse', optimizer=opt)
model.fit(x_train, y_train, epochs=10, batch_size=10)

读者也可以直接跑一跑mnist_mlp_example.py。

链接

https://kexue.fm/archives/6794

交流

QQ交流群：67729435，微信群请加机器人微信号spaces_ac_cn

bert4keras

keras implement of transformers for humans

attention

some attention implements

vae

a simple vae and cvae from keras

kg-2019

2019年百度的三元组抽取比赛，“科学空间队”源码

bert_in_keras

在Keras下微调Bert的一些例子；some examples of bert in keras

SimCSE

SimCSE在中文任务上的简单实验

word-discovery

速度更快、效果更好的中文新词发现

BERT-whitening

简单的向量白化改善句向量质量

SPACES

端到端的长本文摘要模型（法研杯2020司法摘要赛道）

Capsule

A Capsule Implement with Pure Keras

seq2seq

keras example of seq2seq, auto title

CoSENT

比Sentence-BERT更有效的句向量方案

gan

some demo of GANs

crf

keras implementation of conditional random field

lic2020_baselines

some baselines for lic2020 (http://lic2020.cipsc.org.cn/)

kg-2019-baseline

2019年百度的三元组抽取比赛，一个baseline

GlobalPointer

全局指针统一处理嵌套与非嵌套NER

flow

Keras implement of flow-based models

NBCE

Naive Bayes-based Context Extension

keras_lookahead

lookahead optimizer for keras

dgcnn_for_reading_comprehension

keras implement of dgcnn for reading comprehension

t5_in_bert4keras

整理一下在keras中使用T5模型的要点

Pattern-Exploiting-Training

Pattern-Exploiting Training在中文上的简单实验

on-lstm

Keras implement of ON-LSTM (Ordered Neurons: Integrating Tree Structures into Recurrent Neural Networks)

Keras-DDPM

生成扩散模型的Keras实现

infomax

extract features by maximizing mutual information

nlp-zero

基于最小熵原理的NLP工具包

oppo-text-match

小布助手对话短文本语义匹配的一个baseline

CLUE-bert4keras

真 · “Deep Learning for Humans”

o-gan

O-GAN: Extremely Concise Approach for Auto-Encoding Generative Adversarial Networks

P-tuning

P-tuning方法在中文上的简单实验

labse

Language-agnostic BERT Sentence Embedding (LaBSE)

ee-2019-baseline

面向金融领域的事件主体抽取（ccks2019），一个baseline

tf_word2vec

a tensorflow version of Word2Vec with a new loss

el-2019-baseline

2019年百度的实体链指比赛（ccks2019），一个baseline

GPLinker

基于GlobalPointer的实体/关系/事件抽取

gan-qp

GAN-QP: A Novel GAN Framework without Gradient Vanishing and Lipschitz Constraint

el-2019

2019年百度的实体链接比赛，“科学空间队”源码

perturbed_masking

基于BERT的无监督分词和句法分析

margin-softmax

keras sparse implement of margin-softmax

chinese-gen

中文生成式预训练模型

nezha_gpt_dialog

r-drop

R-Drop方法在中文任务上的简单实验

n2n-ocr-for-qqcaptcha

an n2n ocr for qq captcha, 端到端的腾讯验证码识别

ape210k_baseline

用bert4keras来解小学数学应用题

keras_radam

RAdam optimizer for keras

KgCLUE-bert4keras

基于“Seq2Seq+前缀树”的知识图谱问答

albert_zh

转换 https://github.com/brightmart/albert_zh 到google格式

CCL_CMRC2017

第一届“讯飞杯”中文机器阅读理解评测参考模型

simple-chinese-ocr

A Simple Chinese OCR from tipdm contest

CPM_LM_bert4keras

在bert4keras下加载CPM_LM模型

univae

基于Transformer的单模型、多尺度的VAE模型

unsupervised-text-generation

无监督文本生成的一些方法

sohu2021-baseline

2021搜狐校园文本匹配算法大赛baseline

keras_adversarial_training

Adversarial Training for NLP in Keras

bytepiece

更纯粹、更高压缩率的Tokenizer

infomap

a beautiful method for cluster or community detection

gpt_cchess

bert4keras实现gpt下中国象棋

rnn

一些RNN的实现

CDial-GPT-tf

用bert4keras加载CDial-GPT

tiger

A Tight-fisted Optimizer

T-GANs

Training Generative Adversarial Networks Via Turing Test

keras_recompute

saving memory by recomputing for keras

bert-of-theseus

bert-of-theseus via bert4keras

shuffle

Python下shuffle几百G文件

text_compare

用python比较两个字符串差异，高亮差异部分

mydog

监控文件改动，随时自动备份，彻底防止误删

pytorch_bert_to_tf

pytorch版bert权重转tf

nezha

精简版NEZHA模型权重

keras_lazyoptimizer

Keras implement of Lazy optimizer

unsupervised-vocabulary-search

完整的新词发现&词库构建例子

adafactor

adafactor optimizer for keras

NNCWS

Neutral Network based Chinese Segment System

exposure_bias

some strategies for exposure bias in seq2seq

vib

Variational Information Bottleneck

antiminer

简单的挖矿病毒查杀脚本

lic2021_baselines

目前只有阅读理解赛道的

LST-CLUE

Ladder Side-Tuning在CLUE上的简单尝试

FSQ

Keras implement of Finite Scalar Quantization

baidu_dog_classifier

analytical-classification

逻辑回归和单层softmax的解析解

baidu-ner-contest

a bilstm-seq2seq ner script from baidu-ner contest

memm

Keras implementation of Maximum Entropy Markov Model

python-snippets

some frequently-used snippets for python

adax

AdaX optimizer for keras

beiguo

根据进程pid找对应的container