v1.9.0 Now Available with HF Token Auth

AI Emergency
SOS Always Ready

Your lifeline AI assistant that works anywhere — subway, airplane, disaster zone, dead zones. Small Language Models running directly on-device. Zero cloud. Zero dependency. Always operational, always private.

100% On-Device
Zero Network Calls
llama.cpp Native
Sideload Only
ai-sos
Explain quantum computing in simple terms
Quantum computing uses quantum bits (qubits) that can exist in multiple states at once, unlike regular bits that are either 0 or 1...
24 tokens/sec
Can you give me a recipe for pasta?
Here's a simple pasta aglio e olio recipe: 🍝

1. Boil pasta...
2. Sauté garlic...
Type a message...
0
Requêtes Cloud
~50
Mo binaire
20+
Architectures GGUF
Inférence Offline

Powerful Features

Everything you need to run AI models locally on your device with complete privacy

Offline AI

Run language models directly on your device without any internet connectivity. Your data never leaves your phone.

Complete Privacy

All processing happens on-device. Your conversations, prompts, and data are never stored on external servers.

Multiple Models

Download and swap between various SLMs including Danube 2/3, Phi, Gemma 2, Qwen, and more.

Custom Pals

Create personalized AI assistants with different personalities, system prompts, and contextual parameters.

Benchmarking

Test and compare model performance with built-in benchmarking. View tokens per second and memory usage metrics.

Distribution SaaS

Modèle SaaS unique : APK/IPA auto-installables. Gestion centralisée des licences, push OTA des mises à jour, déploiement sans store officiel.

Architecture 100% Local

01. DOWNLOAD

GGUF models téléchargés une fois, stockés en local. Connection internet uniquement pour le fetch initial.

02. INFERENCE

llama.cpp compilé en binaire natif (Android NDK / iOS CoreML). Zero call réseau pendant l'inférence.

03. STORAGE

SQLite locale pour les conversations, AsyncStorage pour la config. Aucune sync cloud, aucun analytics.

Backend: llama.cpp (C/C++) Runtime: React Native (JS bridge minimale) State: MobX (local only) Network: 0 req/sec en usage

IA Système Intégrées — Prêtes en Cas d'Urgence

Deux cerveaux d'urgence toujours disponibles, même sans réseau, sans cloud, sans rien. Installées une fois, opérationnelles pour toujours. Votre SOS technologique permanent.

SYSTÈME
Ultra-Léger

TinyLlama 1.1B

Intégré nativement - toujours disponible

Taille système ~600 MB
Vitesse typique 15-25 tok/sec
Status Stocké local

Fonctions système :

  • Chat général & Q/R instantané
  • Résumés de texte offline
  • Traductions sans connexion
GGUF • Q4_K_M • 1.1B params Système
SYSTÈME
Haute Performance

Phi-2 2.7B

Intégré nativement - raisonnement avancé

Taille système ~1.6 GB
Vitesse typique 8-15 tok/sec
Status Stocké local

Fonctions système :

  • Code & programmation offline
  • Raisonnement logique avancé
  • Analyse de texte complexe
GGUF • Q4_K_M • 2.7B params Système

Mode SOS Activé — Système Autonome URGENCE READY

Ces deux modèles IA sont intégrés en dur dans le système ai-sos. Ils résident dans la partition système de secours, disponibles immédiatement sans configuration, sans téléchargement, sans mise à jour, sans connexion. Votre assistant d'urgence technologique est autonome et permanent. [SOS_ROOT]/emergency/tinyllama-1.1b-sos.gguf | [SOS_ROOT]/emergency/phi-2-sos.gguf

Solution d'Urgence Ultime

ai-sos Local

Un seul fichier HTML. Double-cliquez pour ouvrir. L'IA fonctionne immédiatement dans votre navigateur, sans installation, sans serveur, sans cloud.

Fichier Unique

Un seul fichier local.html à conserver sur clé USB ou envoyer par email. 100% portable.

IA Intégrée WebAssembly

TinyLlama 1.1B et Phi-2 2.7B exécutés localement via Transformers.js de Hugging Face.

Offline Après Premier Chargement

Les modèles sont téléchargés une fois et stockés dans le cache du navigateur. Fonctionne sans internet ensuite.

Lancer ai-sos Local
local.html — Navigateur
ai-sos Local
Modèle actif — 100% offline
Explique la médecine d'urgence
La médecine d'urgence traite les conditions critiques nécessitant une intervention immédiate. ABC : Airway, Breathing, Circulation...
18 tokens/sec — WebAssembly
Message d'urgence...
Zéro Installation

News & Updates

Stay updated with the latest features and improvements

v1.9.0

HF Token Authentication

Access gated models from Hugging Face with your personal authentication token. April 2025

v1.8.16

Localization Support

Now supporting multiple languages including Japanese and Chinese. April 2025

v1.8.12

iPad Support

Full support for iPad devices including landscape orientation. March 2025

v1.8.0

Pals Feature

Create and chat with personalized AI assistants with different personalities. February 2025

Déployer Votre SOS

Configuration d'urgence ai-sos en 3 étapes — opérationnel hors ligne

1

Download a Model

Open the Models page and download from the list, or add from Hugging Face Hub. Choose the right quantization for your device.

2

Load & Configure

Tap Load to bring the model into memory. Customize inference settings like temperature, system prompts, and chat templates.

3

Start Chatting

Navigate to the Chat page and start conversing! Edit messages, retry generation, or switch between different Pals.

Pro Tips

Use Pals for Different Tasks

Create specialized assistants for coding, creative writing, or roleplay with custom system prompts

Benchmark Your Device

Run benchmarks to find the optimal model size and quantization for your specific device

Long-press to Copy

Long-press any paragraph to copy specific sections, or use the copy icon for entire responses

HF Token for Gated Models

Add your Hugging Face token in settings to access premium gated models like Llama

Modèle SaaS Révolutionnaire

SaaS qui S'Installe Seul

Pas de Play Store. Pas d'App Store. Un SaaS d'IA d'urgence qui se déploie directement sur vos appareils via APK/IPA auto-installables.

Gestion centralisée des modèles IA, abonnement SaaS, mais exécution 100% locale auto-installée.

AUTO-INSTALL

Android APK SaaS

Téléchargement direct du client ai-sos sous forme d'APK. S'installe automatiquement après autorisation unique "Sources inconnues". Mise à jour OTA (Over-The-Air) intégrée via le SaaS.

  • Installation sans Play Store
  • Mises à jour silencieuses via SaaS
  • Gestion des modèles IA depuis le dashboard
ai-sos-android-v2.apk ~45 MB
SIDELOAD+

iOS IPA Enterprise

Distribution IPA via profil enterprise ou AltStore automatisé. Installation en un clic via lien magique sécurisé. Renouvellement automatique des certificats via le SaaS.

  • Sans compte développeur Apple ($99/an)
  • AltStore auto-configuré par le SaaS
  • Push des modèles IA depuis le cloud privé
ai-sos-ios-v2.ipa ~52 MB

Dashboard SaaS

Gérez vos déploiements, modèles IA, et utilisateurs depuis une interface web centralisée.

OTA Updates

Mises à jour automatiques des APK/IPA et des modèles IA poussées depuis le SaaS.

Licence par Appareil

Authentification matérielle (HWID). Chaque appareil licencié reçoit les mises à jour automatiquement.

Comment ça marche : SaaS + APK Auto-installé

1
Abonnement SaaS

Créez un compte sur le dashboard ai-sos. Choisissez votre plan (Solo, Team, Enterprise).

2
Téléchargement APK

Téléchargez le client ai-sos.apk ou recevez le lien magique par SMS/Email.

3
Auto-Installation

L'APK s'installe automatiquement, s'enregistre avec votre licence SaaS, et pull les modèles IA.

4
Gestion à Distance

Poussez de nouveaux modèles IA, mettez à jour l'app, et supervisez depuis le dashboard.

Plans SaaS ai-sos

Tarification transparente. Déploiement illimité d'APK, facturation par appareil actif.

Solo

Pour les utilisateurs individuels

€9/mois
  • 1 appareil licencié
  • Modèles IA système inclus
  • Mises à jour OTA
  • Support par email
POPULAIRE

Team

Pour les équipes et familles

€29/mois
  • 5 appareils licenciés
  • Tous les modèles IA premium
  • Dashboard de gestion
  • Push de modèles custom
  • Priorité support

Enterprise

Déploiement massif

Sur mesure
  • Appareils illimités
  • APK white-label
  • API SaaS complète
  • Support dédié 24/7

Chaque appareil nécessite une licence active. Les APK/IPA ne fonctionnent pas sans abonnement SaaS valide.

Téléchargez le Client ai-sos

Téléchargez l'APK ou l'IPA officiel. Nécessite un compte SaaS actif pour l'activation.

Installation Requiert une Licence

Ces fichiers APK/IPA sont des clients vides qui nécessitent une activation via le SaaS ai-sos. Sans abonnement actif, l'application reste en mode démo limité. Créez un compte pour obtenir votre clé d'activation.

Open Source & Community Driven

PocketPal AI is built by the community, for the community. We welcome contributions of all kinds, from code to documentation.

Contribute on GitHub

Fork the repo, create a branch, and submit a PR. Follow conventional commits format.

Report Issues

Found a bug or have a feature request? Open an issue on GitHub.

Share Feedback

Use the in-app feedback feature to share your thoughts directly with the team.

View on GitHub
terminal

$ git clone https://github.com/a-ghorbani/pocketpal-ai

$ cd pocketpal-ai

$ yarn install

$ cd ios && pod install

$ yarn ios # or yarn android

Built with amazing open source technologies

llama.cpp
React Native
MobX
React Native Paper
React Navigation