GitHub - 0xnu/tipus-micro-llm: Character-level and token-based language models implemented in pure PyTorch.

Tipus Micro-LLM

Important

Give me GPUs, and I'll train open-source LLMs with internet access for shits and giggles. 😁 😎

Character-level and token-based language models implemented in pure PyTorch, featuring:

Character-level language model with:
- 128 token block size
- 6 transformer layers
- 8 attention heads
- 512 embedding dimensions
Token-based language model with:
- 256 token block size
- 8 transformer layers
- 8 attention heads
- 768 embedding dimensions
Transformer decoder architecture with causal masking
Training on next-character prediction (character-level)
Training on next-token prediction (token-based)
FastAPI-based REST API for text generation

Model Architecture (Character-level)

Block size: 128 tokens
6 transformer layers
8 attention heads
512 embedding dimensions
Dropout rate: 0.1
Batch size: 64
Maximum iterations: 5,000
Learning rate: 3e-4

Model Architecture (Token-based)

Block size: 256 tokens
8 transformer layers
8 attention heads
768 embedding dimensions
Dropout rate: 0.1
Batch size: 32
Maximum iterations: 10,000
Learning rate: 1e-4

Install Dependencies

Use the package manager pip to install following

## Prerequisites
python3 -m venv .venv
source .venv/bin/activate
uv pip install -r requirements.txt
python3 -m pip install --upgrade pip

Training

python3 -m tipus ## Character-level language model
python3 -m tipus_pairs ## Token-based language model

Training Comparison (Character-level)

Training time for corpus.txt with 5000 iterations:

Device	Training Time	Equivalent in Hours	Iterations
Apple M4 MacBook Pro (16GB RAM, 1TB Storage)	178 minutes	2.97 hours	5000
NVIDIA Tesla P100 GPU	20 minutes 😂	0.33 hours	5000

The model will:

Load training data from data/corpus.txt
Train for 5000 iterations
Save model checkpoints to model/ directory

Training Comparison (Token-based)

Training time for qa_pairs.json with 10,000 iterations:

Device	Training Time	Equivalent in Hours	Iterations
Apple M4 MacBook Pro (16GB RAM, 1TB Storage)	680 minutes	11.33 hours	10000
NVIDIA Tesla P100 GPU	25 minutes 😂	0.42 hours	10000

The model will:

Load training data from data/qa_pairs.json
Train for 10,000 iterations
Save model checkpoints to model/ directory

API Usage

Start the FastAPI server:

uvicorn serve:app --host 0.0.0.0 --port 2025 ## Character-level language model
uvicorn serve_pairs:app --host 0.0.0.0 --port 2025 ## Token-based language model

Generate Text (Character-level)

curl -X POST http://localhost:2025/generate \
     -H "Content-Type: application/json" \
     -d '{"prompt":"Creativity is ", "max_new_tokens":26, "temperature":0.8, "top_k": 1}'

API Parameters (Character-level)

prompt: Initial text to continue
max_new_tokens: Maximum length of generated text
temperature: Controls randomness (lower = more deterministic)
top_k: Limits vocabulary to top-k most likely tokens

Generate Text (Token-based)

## Token-based
curl -X POST http://localhost:2025/generate \
     -H "Content-Type: application/json" \
     -d '{"question":"What is the capital of France?", "max_length":120, "temperature":0.7}'

Name		Name	Last commit message	Last commit date
Latest commit History 23 Commits
.devcontainer		.devcontainer
.github		.github
architecture		architecture
data		data
logs		logs
model		model
notebooks		notebooks
.gitattributes		.gitattributes
.gitignore		.gitignore
CHANGELOG.md		CHANGELOG.md
CODEOWNERS		CODEOWNERS
CODE_OF_CONDUCT.md		CODE_OF_CONDUCT.md
CONTRIBUTING.md		CONTRIBUTING.md
LICENSE		LICENSE
README.md		README.md
SECURITY.md		SECURITY.md
requirements.txt		requirements.txt
serve.py		serve.py
serve_pairs.py		serve_pairs.py
tipus.py		tipus.py
tipus_pairs.py		tipus_pairs.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Tipus Micro-LLM

Model Architecture (Character-level)

Model Architecture (Token-based)

Install Dependencies

Training

Training Comparison (Character-level)

Training Comparison (Token-based)

API Usage

Generate Text (Character-level)

API Parameters (Character-level)

Generate Text (Token-based)

API Parameters (Token-based)

License

Copyright

About

Uh oh!

Releases 4

Packages

Uh oh!

Languages

License

0xnu/tipus-micro-llm

Folders and files

Latest commit

History

Repository files navigation

Tipus Micro-LLM

Model Architecture (Character-level)

Model Architecture (Token-based)

Install Dependencies

Training

Training Comparison (Character-level)

Training Comparison (Token-based)

API Usage

Generate Text (Character-level)

API Parameters (Character-level)

Generate Text (Token-based)

API Parameters (Token-based)

License

Copyright

About

Topics

Resources

License

Code of conduct

Contributing

Security policy

Uh oh!

Stars

Watchers

Forks

Releases 4

Packages 0

Uh oh!

Languages

Packages