Together

Enterprise

company

Verified

https://together.ai

togethercompute

togethercomputer

AI & ML interests

Foundation Models, Decentralized Computing, Open Source AI.

Recent Activity

JunxiongWang authored a paper 14 days ago

M1: Towards Scalable Test-Time Compute with Mamba Reasoning Models

mryab authored a paper 3 months ago

Towards Best Practices for Open Datasets for LLM Training

jason136 authored a paper 4 months ago

METAGENE-1: Metagenomic Foundation Model for Pandemic Monitoring

View all activity

Articles

Welcome to Inference Providers on the Hub 🔥

togethercomputer's activity

JunxiongWang

authored a paper 14 days ago

M1: Towards Scalable Test-Time Compute with Mamba Reasoning Models

Paper • 2504.10449 • Published 14 days ago • 10

percyliang

authored 2 papers 3 months ago

Language Models Prefer What They Know: Relative Confidence Estimation via Confidence Preferences

Paper • 2502.01126 • Published Feb 3 • 4

s1: Simple test-time scaling

Paper • 2501.19393 • Published Jan 31 • 120

mryab

authored a paper 3 months ago

Towards Best Practices for Open Datasets for LLM Training

Paper • 2501.08365 • Published Jan 14 • 61

jason136

authored a paper 4 months ago

METAGENE-1: Metagenomic Foundation Model for Pandemic Monitoring

Paper • 2501.02045 • Published Jan 3 • 21

kezhentogether

authored a paper 5 months ago

RedPajama: an Open Dataset for Training Large Language Models

Paper • 2411.12372 • Published Nov 19, 2024 • 56

benathi

authored a paper 5 months ago

RedPajama: an Open Dataset for Training Large Language Models

Paper • 2411.12372 • Published Nov 19, 2024 • 56

VirginiaAdams

authored a paper 5 months ago

RedPajama: an Open Dataset for Training Large Language Models

Paper • 2411.12372 • Published Nov 19, 2024 • 56

percyliang

authored a paper 5 months ago

RedPajama: an Open Dataset for Training Large Language Models

Paper • 2411.12372 • Published Nov 19, 2024 • 56

mryab

authored a paper 5 months ago

RedPajama: an Open Dataset for Training Large Language Models

Paper • 2411.12372 • Published Nov 19, 2024 • 56

biyuan

authored a paper 7 months ago

Multi-Agent Collaborative Data Selection for Efficient LLM Pretraining

Paper • 2410.08102 • Published Oct 10, 2024 • 20

percyliang

authored a paper 7 months ago

Instruction Following without Instruction Tuning

Paper • 2409.14254 • Published Sep 21, 2024 • 31

xiaoxiawu123

authored a paper 7 months ago

GRIN: GRadient-INformed MoE

Paper • 2409.12136 • Published Sep 18, 2024 • 16

danielepaliotta

authored a paper 8 months ago

The Mamba in the Llama: Distilling and Accelerating Hybrid Models

Paper • 2408.15237 • Published Aug 27, 2024 • 42

JunxiongWang

authored a paper 8 months ago

The Mamba in the Llama: Distilling and Accelerating Hybrid Models

Paper • 2408.15237 • Published Aug 27, 2024 • 42

rhubarbwu

authored 2 papers 10 months ago

NeuralArTS: Structuring Neural Architecture Search with Type Theory

Paper • 2110.08710 • Published Oct 17, 2021

Towards One Shot Search Space Poisoning in Neural Architecture Search

Paper • 2111.07138 • Published Nov 13, 2021

mryab

authored a paper 10 months ago

Distributed Methods with Compressed Communication for Solving Variational Inequalities, with Theoretical Guarantees

Paper • 2110.03313 • Published Oct 7, 2021 • 1

percyliang

authored a paper 11 months ago

OpenVLA: An Open-Source Vision-Language-Action Model

Paper • 2406.09246 • Published Jun 13, 2024 • 40

rhubarbwu

authored a paper 11 months ago

Poisoning the Search Space in Neural Architecture Search

Paper • 2106.14406 • Published Jun 28, 2021