poutyne-transformers

Train 🤗 -transformers models with Poutyne.

Installation

pip install poutyne-transformers

Example

import torch
from transformers import AutoModelForSequenceClassification, AutoTokenizer
from datasets import load_dataset
from torch.utils.data import DataLoader
from torch import optim
from poutyne import Model
from poutyne_transformers import TransformerCollator, model_loss, ModelWrapper

print('Loading model & tokenizer.')
transformer = AutoModelForSequenceClassification.from_pretrained('distilbert-base-cased', num_labels=2, return_dict=True)
tokenizer = AutoTokenizer.from_pretrained('distilbert-base-cased')

print('Loading & preparing dataset.')
dataset = load_dataset("imdb")
dataset = dataset.map(lambda entry: tokenizer(entry['text'], add_special_tokens=True, padding='max_length', truncation=True), batched=True)
dataset = dataset.remove_columns(['text'])
dataset.set_format('torch')

collate_fn = TransformerCollator()
train_dataloader = DataLoader(dataset['train'], batch_size=16, collate_fn=collate_fn)
test_dataloader = DataLoader(dataset['test'], batch_size=16, collate_fn=collate_fn)

print('Preparing training.')
wrapped_transformer = ModelWrapper(transformer)
optimizer = optim.AdamW(wrapped_transformer.parameters(), lr=5e-5)
device = torch.device('cuda:0' if torch.cuda.is_available() else "cpu")
model = Model(wrapped_transformer, optimizer, loss_function=model_loss, device=device)

print('Starting training.')
model.fit_generator(train_dataloader, test_dataloader, epochs=1)

Train 🤗-transformers model with Poutyne.

Related tags

Overview

poutyne-transformers

Installation

Example

Owner

Lennart Keller

Creating an Audiobook (mp3 file) using a Ebook (epub) using BeautifulSoup and Google Text to Speech

Rich Prosody Diversity Modelling with Phone-level Mixture Density Network

Faster, modernized fork of the language identification tool langid.py

MRC approach for Aspect-based Sentiment Analysis (ABSA)

A PyTorch-based model pruning toolkit for pre-trained language models

Official code for Spoken ObjectNet: A Bias-Controlled Spoken Caption Dataset

Jarvis is a simple Chatbot with a GUI capable of chatting and retrieving information and daily news from the internet for it's user.

Utility for Google Text-To-Speech batch audio files generator. Ideal for prompt files creation with Google voices for application in offline IVRs

Repository for the paper "Optimal Subarchitecture Extraction for BERT"

Sequence Modeling with Structured State Spaces

[AAAI 21] Curriculum Labeling: Revisiting Pseudo-Labeling for Semi-Supervised Learning

A complete NLP guideline for enthusiasts

CCKS-Title-based-large-scale-commodity-entity-retrieval-top1

Word Bot for JKLM Bomb Party

Training open neural machine translation models

Simple and efficient RevNet-Library with DeepSpeed support

Generate custom detailed survey paper with topic clustered sections and proper citations, from just a single query in just under 30 mins !!

2021搜狐校园文本匹配算法大赛baseline

SpeechBrain is an open-source and all-in-one speech toolkit based on PyTorch.