llama-cpp-python

abetlen/llama-cpp-python

Fork 0

mirror of https://github.com/abetlen/llama-cpp-python.git synced 2026-03-29 23:57:26 +00:00

Commit Graph

Select branches

Hide Pull Requests

abetlen/bump-version-0.3.18

abetlen/fix-cuda-real-arch

abetlen/fix-hf-download-checks

abetlen/fix-macos-runner-label

abetlen/setup-ruff

abetlen/update-llama-cpp-bindings

add-paligemma-support

batch-processing

binary-wheels

dependabot/github_actions/conda-incubator/setup-miniconda-3.1.1

dependabot/github_actions/pypa/cibuildwheel-2.23.2

dependabot/pip/starlette-context-gte-0.3.6-and-lt-0.5

dev-add-rpc

docker

expose-libggml

fix-embeddings-for-non-embedding-models

fix-windows-import-error

generic-vlm-chat-format

main

patch-1

patch-3

remove-unwanted-bos

update-sampling-api

#10

#1002

#1005

#1007

#1010

#1011

#1012

#1015

#1019

#1021

#1023

#1028

#1037

#1050

#1052

#1058

#1059

#1067

#1067

#1068

#1078

#108

#1080

#1080

#1086

#1087

#1088

#1090

#1092

#1093

#1106

#1106

#111

#1110

#1115

#1116

#1120

#1122

#1131

#1136

#1147

#1156

#1157

#1160

#1160

#1170

#1170

#1172

#1175

#1176

#1179

#118

#1184

#1186

#1187

#1188

#119

#1193

#1194

#1205

#1206

#1209

#1209

#1210

#1212

#1212

#1214

#1222

#1230

#1232

#1244

#1246

#1247

#1248

#125

#1257

#126

#1263

#1264

#1272

#1273

#1281

#1281

#1282

#1289

#1295

#1296

#130

#1307

#1311

#1317

#1330

#1331

#1331

#1333

#1345

#1347

#135

#1350

#1351

#1351

#1353

#1364

#137

#1370

#1371

#1374

#1374

#1375

#1380

#1382

#1382

#1383

#1383

#1385

#1386

#1387

#1388

#139

#1390

#1391

#1392

#1396

#1397

#1398

#1399

#140

#1400

#1401

#1407

#1407

#1408

#1409

#1410

#1411

#1412

#1413

#1415

#1416

#1419

#1424

#1426

#1427

#1427

#1430

#1432

#1433

#1434

#1439

#144

#144

#1440

#1440

#1441

#1444

#1448

#1449

#1453

#1457

#1459

#146

#146

#1462

#1465

#1471

#1472

#1476

#1477

#1486

#1486

#1492

#1493

#1497

#15

#1503

#1503

#1509

#1509

#1513

#1514

#1515

#1515

#1516

#1522

#1525

#1526

#1527

#153

#1530

#1539

#154

#1544

#1550

#1550

#1551

#1552

#1552

#156

#1568

#1569

#157

#1576

#1583

#1583

#1585

#1589

#1590

#1594

#1596

#1597

#160

#1605

#1605

#161

#1613

#1613

#162

#1626

#163

#1630

#1632

#1633

#1634

#1635

#1637

#164

#1649

#165

#1651

#1651

#1653

#1656

#1657

#1658

#1659

#1667

#1668

#1673

#1677

#1677

#1679

#168

#1680

#1704

#1716

#1716

#1718

#1718

#172

#172

#1721

#173

#1738

#1739

#1739

#1741

#1742

#1743

#1750

#1751

#1758

#1758

#176

#176

#1761

#177

#1775

#1776

#1776

#1777

#1777

#178

#1782

#1782

#1783

#1786

#1786

#1788

#1790

#1791

#1791

#1793

#1795

#1796

#1798

#1800

#1800

#1802

#1807

#1817

#1817

#1819

#1820

#1820

#1821

#1825

#1825

#1833

#1834

#1834

#1838

#1842

#1842

#1843

#1843

#1844

#1845

#1858

#1862

#1864

#1864

#1867

#1867

#1871

#1877

#1877

#1878

#1878

#1879

#1884

#1884

#1887

#1887

#189

#1894

#1898

#1899

#1899

#190

#1901

#191

#1911

#1911

#1912

#1959

#1961

#1961

#1966

#1971

#1971

#1973

#1974

#1978

#198

#198

#1980

#1981

#1981

#1989

#1989

#1991

#1991

#2007

#2007

#2009

#2015

#2015

#2018

#2018

#2025

#2025

#2027

#203

#2030

#2034

#2034

#2039

#2039

#2040

#2041

#2041

#2042

#2042

#2044

#2044

#2046

#2049

#2056

#2056

#2058

#2058

#2059

#2059

#2066

#2066

#2071

#2071

#2072

#2072

#2077

#2082

#2082

#2083

#2083

#2085

#2085

#2088

#2088

#2099

#2099

#2100

#2102

#2102

#2108

#2108

#2109

#2109

#2112

#212

#2120

#2120

#2121

#2121

#2128

#2128

#2129

#2129

#2131

#2131

#2132

#2133

#2134

#2134

#2139

#214

#2141

#2141

#2143

#2147

#2147

#2148

#2149

#215

#2150

#2151

#2152

#2153

#2154

#2155

#2156

#2157

#2158

#2160

#2161

#2162

#2164

#2164

#2165

#2166

#217

#225

#235

#240

#246

#248

#249

#251

#252

#258

#262

#263

#264

#265

#270

#271

#274

#277

#28

#289

#29

#292

#293

#294

#295

#296

#297

#309

#310

#322

#323

#324

#325

#326

#328

#329

#329

#350

#351

#359

#360

#365

#366

#367

#368

#370

#376

#385

#390

#392

#402

#405

#41

#414

#414

#415

#42

#420

#429

#430

#431

#432

#435

#436

#442

#443

#444

#452

#453

#456

#460

#466

#481

#485

#486

#498

#499

#50

#501

#505

#505

#508

#511

#516

#517

#517

#521

#522

#523

#525

#530

#531

#532

#536

#540

#540

#548

#549

#55

#550

#551

#556

#564

#565

#567

#572

#573

#575

#575

#577

#583

#584

#594

#594

#598

#600

#604

#61

#610

#611

#612

#621

#624

#624

#625

#63

#631

#631

#633

#64

#644

#647

#648

#667

#668

#669

#670

#671

#678

#678

#680

#682

#684

#688

#690

#691

#692

#694

#694

#703

#704

#705

#709

#709

#711

#713

#716

#716

#73

#730

#733

#733

#748

#752

#752

#76

#767

#768

#772

#778

#781

#783

#784

#790

#795

#798

#799

#803

#808

#809

#820

#821

#824

#824

#826

#83

#834

#835

#842

#843

#843

#846

#848

#849

#850

#851

#854

#855

#864

#868

#868

#869

#87

#875

#892

#913

#913

#920

#921

#922

#922

#925

#927

#93

#930

#931

#934

#936

#937

#938

#940

#947

#951

#951

#952

#955

#955

#957

#958

#961

#962

#962

#967

#98

#986

#991

#993

#993

#994

#996

v0.1.29

v0.1.30

v0.1.31

v0.1.32

v0.1.33

v0.1.34

v0.1.35

v0.1.36

v0.1.37

v0.1.38

v0.1.39

v0.1.40

v0.1.41

v0.1.42

v0.1.43

v0.1.44

v0.1.45

v0.1.46

v0.1.47

v0.1.48

v0.1.49

v0.1.50

v0.1.51

v0.1.52

v0.1.53

v0.1.54

v0.1.55

v0.1.56

v0.1.57

v0.1.59

v0.1.60

v0.1.61

v0.1.62

v0.1.63

v0.1.64

v0.1.65

v0.1.66

v0.1.67

v0.1.68

v0.1.69

v0.1.70

v0.1.71

v0.1.72

v0.1.73

v0.1.74

v0.1.75

v0.1.76

v0.1.77

v0.1.78

v0.1.79

v0.1.80

v0.1.81

v0.1.82

v0.1.83

v0.1.84

v0.1.85

v0.2.0

v0.2.1

v0.2.10

v0.2.11

v0.2.12

v0.2.13

v0.2.14

v0.2.15

v0.2.16

v0.2.17

v0.2.18

v0.2.19

v0.2.2

v0.2.20

v0.2.21

v0.2.22

v0.2.23

v0.2.24

v0.2.25

v0.2.26

v0.2.27

v0.2.28

v0.2.29

v0.2.3

v0.2.30

v0.2.31

v0.2.32

v0.2.33

v0.2.34

v0.2.35

v0.2.36

v0.2.37

v0.2.38

v0.2.39

v0.2.4

v0.2.40

v0.2.41

v0.2.42

v0.2.43

v0.2.44

v0.2.45

v0.2.46

v0.2.47

v0.2.48

v0.2.49

v0.2.5

v0.2.50

v0.2.51

v0.2.52

v0.2.53

v0.2.54

v0.2.55

v0.2.56

v0.2.57

v0.2.58

v0.2.59

v0.2.59-cu121

v0.2.59-cu122

v0.2.59-cu123

v0.2.59-metal

v0.2.6

v0.2.60

v0.2.60-cu121

v0.2.60-cu122

v0.2.60-cu123

v0.2.60-metal

v0.2.61

v0.2.61-cu121

v0.2.61-cu122

v0.2.61-cu123

v0.2.61-metal

v0.2.62

v0.2.62-cu121

v0.2.62-cu122

v0.2.62-cu123

v0.2.62-metal

v0.2.63

v0.2.63-cu121

v0.2.63-cu122

v0.2.63-cu123

v0.2.63-metal

v0.2.64

v0.2.64-cu121

v0.2.64-cu122

v0.2.64-cu123

v0.2.64-metal

v0.2.65

v0.2.65-cu121

v0.2.65-cu122

v0.2.65-cu123

v0.2.65-metal

v0.2.66

v0.2.66-cu121

v0.2.66-cu122

v0.2.66-cu123

v0.2.66-cu124

v0.2.66-metal

v0.2.67

v0.2.67-cu121

v0.2.67-cu122

v0.2.67-cu123

v0.2.67-cu124

v0.2.67-metal

v0.2.68

v0.2.68-cu121

v0.2.68-cu122

v0.2.68-cu123

v0.2.68-cu124

v0.2.68-metal

v0.2.69

v0.2.69-cu121

v0.2.69-cu122

v0.2.69-cu123

v0.2.69-cu124

v0.2.69-metal

v0.2.7

v0.2.70

v0.2.70-cu121

v0.2.70-cu122

v0.2.70-cu123

v0.2.70-cu124

v0.2.70-metal

v0.2.71

v0.2.71-cu121

v0.2.71-cu122

v0.2.71-cu123

v0.2.71-cu124

v0.2.71-metal

v0.2.72

v0.2.72-cu121

v0.2.72-cu122

v0.2.72-cu123

v0.2.72-cu124

v0.2.72-metal

v0.2.73

v0.2.73-cu121

v0.2.73-cu122

v0.2.73-cu123

v0.2.73-cu124

v0.2.73-metal

v0.2.74

v0.2.74-cu121

v0.2.74-cu122

v0.2.74-cu123

v0.2.74-cu124

v0.2.74-metal

v0.2.75

v0.2.75-cu121

v0.2.75-cu122

v0.2.75-cu123

v0.2.75-cu124

v0.2.75-metal

v0.2.76

v0.2.76-cu121

v0.2.76-cu122

v0.2.76-cu123

v0.2.76-cu124

v0.2.76-metal

v0.2.77

v0.2.77-cu121

v0.2.77-cu122

v0.2.77-cu123

v0.2.77-cu124

v0.2.77-metal

v0.2.78

v0.2.78-metal

v0.2.79

v0.2.79-metal

v0.2.8

v0.2.80

v0.2.80-metal

v0.2.81

v0.2.81-cu121

v0.2.81-cu122

v0.2.81-cu123

v0.2.81-cu124

v0.2.81-metal

v0.2.82

v0.2.82-cu121

v0.2.82-cu122

v0.2.82-cu123

v0.2.82-cu124

v0.2.82-metal

v0.2.83

v0.2.83-cu121

v0.2.83-cu122

v0.2.83-cu123

v0.2.83-cu124

v0.2.83-metal

v0.2.84

v0.2.84-cu121

v0.2.84-cu122

v0.2.84-cu123

v0.2.84-cu124

v0.2.84-metal

v0.2.85

v0.2.85-cu121

v0.2.85-cu122

v0.2.85-cu123

v0.2.85-cu124

v0.2.85-metal

v0.2.86

v0.2.86-cu121

v0.2.86-cu122

v0.2.86-cu123

v0.2.86-cu124

v0.2.86-metal

v0.2.87

v0.2.87-cu121

v0.2.87-cu122

v0.2.87-cu123

v0.2.87-cu124

v0.2.87-metal

v0.2.88

v0.2.88-cu121

v0.2.88-cu122

v0.2.88-cu123

v0.2.88-cu124

v0.2.88-metal

v0.2.89

v0.2.89-cu121

v0.2.89-cu124

v0.2.89-metal

v0.2.9

v0.2.90

v0.2.90-cu121

v0.2.90-cu122

v0.2.90-cu123

v0.2.90-cu124

v0.2.90-metal

v0.3.0

v0.3.0-metal

v0.3.1

v0.3.1-metal

v0.3.10

v0.3.11

v0.3.11-metal

v0.3.12

v0.3.12-cu121

v0.3.12-cu122

v0.3.12-cu123

v0.3.12-cu124

v0.3.12-metal

v0.3.13

v0.3.13-cu121

v0.3.13-cu122

v0.3.13-cu123

v0.3.13-cu124

v0.3.13-metal

v0.3.14

v0.3.14-cu124

v0.3.14-metal

v0.3.15

v0.3.15-cu121

v0.3.15-cu122

v0.3.15-cu123

v0.3.15-cu124

v0.3.15-metal

v0.3.16

v0.3.16-cu121

v0.3.16-cu122

v0.3.16-cu123

v0.3.16-cu124

v0.3.16-metal

v0.3.17

v0.3.17-metal

v0.3.18

v0.3.18-cu121

v0.3.18-cu122

v0.3.18-cu123

v0.3.18-cu124

v0.3.18-metal

v0.3.19

v0.3.19-cu121

v0.3.19-cu122

v0.3.19-cu123

v0.3.19-cu124

v0.3.19-metal

v0.3.2

v0.3.2-metal

v0.3.3

v0.3.4

v0.3.4-cu121

v0.3.4-cu122

v0.3.4-cu123

v0.3.4-cu124

v0.3.4-metal

v0.3.5

v0.3.5-metal

v0.3.6

v0.3.7

v0.3.8

v0.3.9

ea0faabae1 Update llama.cpp Andrei Betlen 2023-04-28 15:32:43 -04:00
b7d14efc8b Python weirdness Mug 2023-04-28 13:20:31 +02:00
eed61289b6 Dont detect off tokens, detect off detokenized utf8 Mug 2023-04-28 13:16:18 +02:00
3a98747026 One day, i'll fix off by 1 errors permanently too Mug 2023-04-28 12:54:28 +02:00
c39547a986 Detect multi-byte responses and wait Mug 2023-04-28 12:50:30 +02:00
9339929f56 Update llama.cpp Andrei Betlen 2023-04-26 20:00:54 -04:00
5f81400fcb Also ignore errors on input prompts Mug 2023-04-26 14:45:51 +02:00
3c130f00ca Remove try catch from chat Mug 2023-04-26 14:38:53 +02:00
be2c961bc9 Merge branch 'main' of https://github.com/abetlen/llama-cpp-python Mug 2023-04-26 14:38:09 +02:00
c4a8491d42 Fix decode errors permanently Mug 2023-04-26 14:37:06 +02:00
cbd26fdcc1 Update llama.cpp Andrei Betlen 2023-04-25 19:03:41 -04:00
3cab3ef4cb Update n_batch for server Andrei Betlen 2023-04-25 09:11:32 -04:00
cc706fb944 Add ctx check and re-order __init__. Closes #112 Andrei Betlen 2023-04-25 09:00:53 -04:00
996e31d861 Bump version v0.1.38 Andrei Betlen 2023-04-25 01:37:07 -04:00
848c83dfd0 Add FORCE_CMAKE option Andrei Betlen 2023-04-25 01:36:37 -04:00
9dddb3a607 Bump version v0.1.37 Andrei Betlen 2023-04-25 00:19:44 -04:00
d484c5634e Bugfix: Check cache keys as prefix to prompt tokens Andrei Betlen 2023-04-24 22:18:54 -04:00
b75fa96bf7 Update docs Andrei Betlen 2023-04-24 19:56:57 -04:00
cbe95bbb75 Add cache implementation using llama state Andrei Betlen 2023-04-24 19:54:41 -04:00
2c359a28ff Merge branch 'main' of github.com:abetlen/llama_cpp_python into main Andrei Betlen 2023-04-24 17:51:27 -04:00
197cf80601 Add save/load state api for Llama class Andrei Betlen 2023-04-24 17:51:25 -04:00
c4c332fc51 Update llama.cpp Andrei Betlen 2023-04-24 17:42:09 -04:00
280a047dd6 Update llama.cpp Andrei Betlen 2023-04-24 15:52:24 -04:00
86f8e5ad91 Refactor internal state for Llama class Andrei Betlen 2023-04-24 15:47:54 -04:00
f37456133a Merge pull request #108 from eiery/main Andrei 2023-04-24 13:48:09 -04:00
02cf881317 Update llama.cpp Andrei Betlen 2023-04-24 09:30:10 -04:00
8476b325f1 Change to bullseye Niek van der Maas 2023-04-24 09:54:38 +02:00
aa12d8a81f Update llama.py eiery 2023-04-23 20:56:40 -04:00
7230599593 Disable mmap when applying lora weights. Closes #107 Andrei Betlen 2023-04-23 14:53:17 -04:00
e99caedbbd Update llama.cpp Andrei Betlen 2023-04-22 19:50:28 -04:00
643b73e155 Bump version v0.1.36 Andrei Betlen 2023-04-21 19:38:54 -04:00
1eb130a6b2 Update llama.cpp Andrei Betlen 2023-04-21 17:40:27 -04:00
ba3959eafd Update llama.cpp Andrei Betlen 2023-04-20 05:15:31 -04:00
207adbdf13 Bump version v0.1.35 Andrei Betlen 2023-04-20 01:48:24 -04:00
3d290623f5 Update llama.cpp Andrei Betlen 2023-04-20 01:08:15 -04:00
e4647c75ec Add use_mmap flag to server Andrei Betlen 2023-04-19 15:57:46 -04:00
207ebbc8dc Update llama.cpp Andrei Betlen 2023-04-19 14:02:11 -04:00
0df4d69c20 If lora base is not set avoid re-loading the model by passing NULL Andrei Betlen 2023-04-18 23:45:25 -04:00
95c0dc134e Update type signature to allow for null pointer to be passed. Andrei Betlen 2023-04-18 23:44:46 -04:00
453e517fd5 Add seperate lora_base path for applying LoRA to quantized models using original unquantized model weights. Andrei Betlen 2023-04-18 10:20:46 -04:00
32ca803bd8 Merge branch 'main' of github.com:abetlen/llama_cpp_python into main Andrei Betlen 2023-04-18 02:22:39 -04:00
b2d44aa633 Update llama.cpp Andrei Betlen 2023-04-18 02:22:35 -04:00
4ce6670bbd Merge pull request #87 from SagsMug/main Andrei 2023-04-18 02:11:40 -04:00
eb7f278cc6 Add lora_path parameter to Llama model Andrei Betlen 2023-04-18 01:43:44 -04:00
35abf89552 Add bindings for LoRA adapters. Closes #88 Andrei Betlen 2023-04-18 01:30:04 -04:00
3f68e95097 Update llama.cpp Andrei Betlen 2023-04-18 01:29:27 -04:00
1b73a15e62 Merge branch 'main' of https://github.com/abetlen/llama-cpp-python Mug 2023-04-17 14:45:42 +02:00
53d17ad003 Fixed end of text wrong type, and fix n_predict behaviour Mug 2023-04-17 14:45:28 +02:00
b2a24bddac Update docs Andrei Betlen 2023-04-15 22:31:14 -04:00
e38485a66d Bump version. v0.1.34 Andrei Betlen 2023-04-15 20:27:55 -04:00
89856ef00d Bugfix: only eval new tokens Andrei Betlen 2023-04-15 17:32:53 -04:00
6df27b2da0 Merge branch 'main' of github.com:abetlen/llama-cpp-python Niek van der Maas 2023-04-15 20:24:59 +02:00
59b37bbbd2 Support openblas Niek van der Maas 2023-04-15 20:24:46 +02:00
887f3b73ac Update llama.cpp Andrei Betlen 2023-04-15 12:16:05 -04:00
92c077136d Add experimental cache Andrei Betlen 2023-04-15 12:03:09 -04:00
a6372a7ae5 Update stop sequences for chat Andrei Betlen 2023-04-15 12:02:48 -04:00
83b2be6dc4 Update chat parameters Andrei Betlen 2023-04-15 11:58:43 -04:00
62087514c6 Update chat prompt Andrei Betlen 2023-04-15 11:58:19 -04:00
02f9fb82fb Bugfix Andrei Betlen 2023-04-15 11:39:52 -04:00
3cd67c7bd7 Add type annotations Andrei Betlen 2023-04-15 11:39:21 -04:00
d7de0e8014 Bugfix Andrei Betlen 2023-04-15 00:08:04 -04:00
e90e122f2a Use clear Andrei Betlen 2023-04-14 23:33:18 -04:00
ac7068a469 Track generated tokens internally Andrei Betlen 2023-04-14 23:33:00 -04:00
25b646c2fb Update llama.cpp Andrei Betlen 2023-04-14 23:32:05 -04:00
6e298d8fca Set kv cache size to f16 by default Andrei Betlen 2023-04-14 22:21:19 -04:00
9c8c2c37dc Update llama.cpp Andrei Betlen 2023-04-14 10:01:57 -04:00
6c7cec0c65 Fix completion request Andrei Betlen 2023-04-14 10:01:15 -04:00
6153baab2d Clean up logprobs implementation Andrei Betlen 2023-04-14 09:59:33 -04:00
26cc4ee029 Fix signature for stop parameter Andrei Betlen 2023-04-14 09:59:08 -04:00
7dc0838fff Bump version v0.1.33 Andrei Betlen 2023-04-13 00:35:05 -04:00
6595ad84bf Add field to disable reseting between generations Andrei Betlen 2023-04-13 00:28:00 -04:00
22fa5a621f Revert "Deprecate generate method" Andrei Betlen 2023-04-13 00:19:55 -04:00
4f5f99ef2a Formatting Andrei Betlen 2023-04-12 22:40:12 -04:00
0daf16defc Enable logprobs on completion endpoint Andrei Betlen 2023-04-12 19:08:11 -04:00
19598ac4e8 Fix threading bug. Closes #62 Andrei Betlen 2023-04-12 19:07:53 -04:00
005c78d26c Update llama.cpp Andrei Betlen 2023-04-12 14:29:00 -04:00
c854c2564b Don't serialize stateful parameters Andrei Betlen 2023-04-12 14:07:14 -04:00
2f9b649005 Style fix Andrei Betlen 2023-04-12 14:06:22 -04:00
6cf5876538 Deprecate generate method Andrei Betlen 2023-04-12 14:06:04 -04:00
b3805bb9cc Implement logprobs parameter for text completion. Closes #2 Andrei Betlen 2023-04-12 14:05:11 -04:00
9ce8146231 More generic model name Niek van der Maas 2023-04-12 11:56:16 +02:00
c14201dc0f Add Dockerfile + build workflow Niek van der Maas 2023-04-12 11:53:39 +02:00
2a60eb820f Update llama.cpp Andrei Betlen 2023-04-11 23:53:46 -04:00
9f1e565594 Update llama.cpp Andrei Betlen 2023-04-11 11:59:03 -04:00
213cc5c340 Remove async from function signature to avoid blocking the server Andrei Betlen 2023-04-11 11:54:31 -04:00
3727ba4d9e Bump version v0.1.32 Andrei Betlen 2023-04-10 12:56:48 -04:00
5247e32d9e Update llama.cpp Andrei Betlen 2023-04-10 12:56:23 -04:00
90e1021154 Add unlimited max_tokens jm12138 2023-04-10 15:56:05 +00:00
ffb1e80251 Bump version v0.1.31 Andrei Betlen 2023-04-10 11:37:41 -04:00
a5554a2f02 Merge pull request #61 from jm12138/fix_windows_install Andrei 2023-04-10 11:35:04 -04:00
adfd9f681c Matched the other encode calls jm12138 2023-04-10 15:33:31 +00:00
0460fdb9ce Merge pull request #28 from SagsMug/local-lib Andrei 2023-04-10 11:32:19 -04:00
2559e5af9b Changed the environment variable name into "LLAMA_CPP_LIB" Mug 2023-04-10 17:27:17 +02:00
63d8a3c688 Merge pull request #63 from SagsMug/main Andrei 2023-04-10 11:23:00 -04:00
ee71ce8ab7 Make windows users happy (hopefully) Mug 2023-04-10 17:12:25 +02:00
cf339c9b3c Better custom library debugging Mug 2023-04-10 17:06:58 +02:00
4132293d2d Merge branch 'main' of https://github.com/abetlen/llama-cpp-python into local-lib Mug 2023-04-10 17:00:42 +02:00
76131d5bb8 Use environment variable for library override Mug 2023-04-10 17:00:35 +02:00
3bb45f1658 More reasonable defaults Mug 2023-04-10 16:38:45 +02:00
0cccb41a8f Added iterative search to prevent instructions from being echoed, add ignore eos, add no-mmap, fixed 1 character echo too much bug Mug 2023-04-10 16:35:38 +02:00

... 18 19 20 21 22 ...