llama-cpp-python

abetlen/llama-cpp-python

Fork 0

mirror of https://github.com/abetlen/llama-cpp-python.git synced 2026-03-28 03:41:34 +00:00

Commit Graph

Select branches

Hide Pull Requests

abetlen/bump-version-0.3.18

abetlen/fix-cuda-real-arch

abetlen/fix-hf-download-checks

abetlen/fix-macos-runner-label

abetlen/setup-ruff

abetlen/update-llama-cpp-bindings

add-paligemma-support

batch-processing

binary-wheels

dependabot/github_actions/conda-incubator/setup-miniconda-3.1.1

dependabot/github_actions/pypa/cibuildwheel-2.23.2

dependabot/pip/starlette-context-gte-0.3.6-and-lt-0.5

dev-add-rpc

docker

expose-libggml

fix-embeddings-for-non-embedding-models

fix-windows-import-error

generic-vlm-chat-format

main

patch-1

patch-3

remove-unwanted-bos

update-sampling-api

#10

#1002

#1005

#1007

#1010

#1011

#1012

#1015

#1019

#1021

#1023

#1028

#1037

#1050

#1052

#1058

#1059

#1067

#1067

#1068

#1078

#108

#1080

#1080

#1086

#1087

#1088

#1090

#1092

#1093

#1106

#1106

#111

#1110

#1115

#1116

#1120

#1122

#1131

#1136

#1147

#1156

#1157

#1160

#1160

#1170

#1170

#1172

#1175

#1176

#1179

#118

#1184

#1186

#1187

#1188

#119

#1193

#1194

#1205

#1206

#1209

#1209

#1210

#1212

#1212

#1214

#1222

#1230

#1232

#1244

#1246

#1247

#1248

#125

#1257

#126

#1263

#1264

#1272

#1273

#1281

#1281

#1282

#1289

#1295

#1296

#130

#1307

#1311

#1317

#1330

#1331

#1331

#1333

#1345

#1347

#135

#1350

#1351

#1351

#1353

#1364

#137

#1370

#1371

#1374

#1374

#1375

#1380

#1382

#1382

#1383

#1383

#1385

#1386

#1387

#1388

#139

#1390

#1391

#1392

#1396

#1397

#1398

#1399

#140

#1400

#1401

#1407

#1407

#1408

#1409

#1410

#1411

#1412

#1413

#1415

#1416

#1419

#1424

#1426

#1427

#1427

#1430

#1432

#1433

#1434

#1439

#144

#144

#1440

#1440

#1441

#1444

#1448

#1449

#1453

#1457

#1459

#146

#146

#1462

#1465

#1471

#1472

#1476

#1477

#1486

#1486

#1492

#1493

#1497

#15

#1503

#1503

#1509

#1509

#1513

#1514

#1515

#1515

#1516

#1522

#1525

#1526

#1527

#153

#1530

#1539

#154

#1544

#1550

#1550

#1551

#1552

#1552

#156

#1568

#1569

#157

#1576

#1583

#1583

#1585

#1589

#1590

#1594

#1596

#1597

#160

#1605

#1605

#161

#1613

#1613

#162

#1626

#163

#1630

#1632

#1633

#1634

#1635

#1637

#164

#1649

#165

#1651

#1651

#1653

#1656

#1657

#1658

#1659

#1667

#1668

#1673

#1677

#1677

#1679

#168

#1680

#1704

#1716

#1716

#1718

#1718

#172

#172

#1721

#173

#1738

#1739

#1739

#1741

#1742

#1743

#1750

#1751

#1758

#1758

#176

#176

#1761

#177

#1775

#1776

#1776

#1777

#1777

#178

#1782

#1782

#1783

#1786

#1786

#1788

#1790

#1791

#1791

#1793

#1795

#1796

#1798

#1800

#1800

#1802

#1807

#1817

#1817

#1819

#1820

#1820

#1821

#1825

#1825

#1833

#1834

#1834

#1838

#1842

#1842

#1843

#1843

#1844

#1845

#1858

#1862

#1864

#1864

#1867

#1867

#1871

#1877

#1877

#1878

#1878

#1879

#1884

#1884

#1887

#1887

#189

#1894

#1898

#1899

#1899

#190

#1901

#191

#1911

#1911

#1912

#1959

#1961

#1961

#1966

#1971

#1971

#1973

#1974

#1978

#198

#198

#1980

#1981

#1981

#1989

#1989

#1991

#1991

#2007

#2007

#2009

#2015

#2015

#2018

#2018

#2025

#2025

#2027

#203

#2030

#2034

#2034

#2039

#2039

#2040

#2041

#2041

#2042

#2042

#2044

#2044

#2046

#2049

#2056

#2056

#2058

#2058

#2059

#2059

#2066

#2066

#2071

#2071

#2072

#2072

#2077

#2082

#2082

#2083

#2083

#2085

#2085

#2088

#2088

#2099

#2099

#2100

#2102

#2102

#2108

#2108

#2109

#2109

#2112

#212

#2120

#2120

#2121

#2121

#2128

#2128

#2129

#2129

#2131

#2131

#2132

#2133

#2134

#2134

#2139

#214

#2141

#2141

#2143

#2147

#2147

#2148

#2149

#215

#2150

#2151

#2152

#2153

#2154

#2155

#2156

#2157

#2158

#2160

#2161

#2162

#2164

#2164

#217

#225

#235

#240

#246

#248

#249

#251

#252

#258

#262

#263

#264

#265

#270

#271

#274

#277

#28

#289

#29

#292

#293

#294

#295

#296

#297

#309

#310

#322

#323

#324

#325

#326

#328

#329

#329

#350

#351

#359

#360

#365

#366

#367

#368

#370

#376

#385

#390

#392

#402

#405

#41

#414

#414

#415

#42

#420

#429

#430

#431

#432

#435

#436

#442

#443

#444

#452

#453

#456

#460

#466

#481

#485

#486

#498

#499

#50

#501

#505

#505

#508

#511

#516

#517

#517

#521

#522

#523

#525

#530

#531

#532

#536

#540

#540

#548

#549

#55

#550

#551

#556

#564

#565

#567

#572

#573

#575

#575

#577

#583

#584

#594

#594

#598

#600

#604

#61

#610

#611

#612

#621

#624

#624

#625

#63

#631

#631

#633

#64

#644

#647

#648

#667

#668

#669

#670

#671

#678

#678

#680

#682

#684

#688

#690

#691

#692

#694

#694

#703

#704

#705

#709

#709

#711

#713

#716

#716

#73

#730

#733

#733

#748

#752

#752

#76

#767

#768

#772

#778

#781

#783

#784

#790

#795

#798

#799

#803

#808

#809

#820

#821

#824

#824

#826

#83

#834

#835

#842

#843

#843

#846

#848

#849

#850

#851

#854

#855

#864

#868

#868

#869

#87

#875

#892

#913

#913

#920

#921

#922

#922

#925

#927

#93

#930

#931

#934

#936

#937

#938

#940

#947

#951

#951

#952

#955

#955

#957

#958

#961

#962

#962

#967

#98

#986

#991

#993

#993

#994

#996

v0.1.29

v0.1.30

v0.1.31

v0.1.32

v0.1.33

v0.1.34

v0.1.35

v0.1.36

v0.1.37

v0.1.38

v0.1.39

v0.1.40

v0.1.41

v0.1.42

v0.1.43

v0.1.44

v0.1.45

v0.1.46

v0.1.47

v0.1.48

v0.1.49

v0.1.50

v0.1.51

v0.1.52

v0.1.53

v0.1.54

v0.1.55

v0.1.56

v0.1.57

v0.1.59

v0.1.60

v0.1.61

v0.1.62

v0.1.63

v0.1.64

v0.1.65

v0.1.66

v0.1.67

v0.1.68

v0.1.69

v0.1.70

v0.1.71

v0.1.72

v0.1.73

v0.1.74

v0.1.75

v0.1.76

v0.1.77

v0.1.78

v0.1.79

v0.1.80

v0.1.81

v0.1.82

v0.1.83

v0.1.84

v0.1.85

v0.2.0

v0.2.1

v0.2.10

v0.2.11

v0.2.12

v0.2.13

v0.2.14

v0.2.15

v0.2.16

v0.2.17

v0.2.18

v0.2.19

v0.2.2

v0.2.20

v0.2.21

v0.2.22

v0.2.23

v0.2.24

v0.2.25

v0.2.26

v0.2.27

v0.2.28

v0.2.29

v0.2.3

v0.2.30

v0.2.31

v0.2.32

v0.2.33

v0.2.34

v0.2.35

v0.2.36

v0.2.37

v0.2.38

v0.2.39

v0.2.4

v0.2.40

v0.2.41

v0.2.42

v0.2.43

v0.2.44

v0.2.45

v0.2.46

v0.2.47

v0.2.48

v0.2.49

v0.2.5

v0.2.50

v0.2.51

v0.2.52

v0.2.53

v0.2.54

v0.2.55

v0.2.56

v0.2.57

v0.2.58

v0.2.59

v0.2.59-cu121

v0.2.59-cu122

v0.2.59-cu123

v0.2.59-metal

v0.2.6

v0.2.60

v0.2.60-cu121

v0.2.60-cu122

v0.2.60-cu123

v0.2.60-metal

v0.2.61

v0.2.61-cu121

v0.2.61-cu122

v0.2.61-cu123

v0.2.61-metal

v0.2.62

v0.2.62-cu121

v0.2.62-cu122

v0.2.62-cu123

v0.2.62-metal

v0.2.63

v0.2.63-cu121

v0.2.63-cu122

v0.2.63-cu123

v0.2.63-metal

v0.2.64

v0.2.64-cu121

v0.2.64-cu122

v0.2.64-cu123

v0.2.64-metal

v0.2.65

v0.2.65-cu121

v0.2.65-cu122

v0.2.65-cu123

v0.2.65-metal

v0.2.66

v0.2.66-cu121

v0.2.66-cu122

v0.2.66-cu123

v0.2.66-cu124

v0.2.66-metal

v0.2.67

v0.2.67-cu121

v0.2.67-cu122

v0.2.67-cu123

v0.2.67-cu124

v0.2.67-metal

v0.2.68

v0.2.68-cu121

v0.2.68-cu122

v0.2.68-cu123

v0.2.68-cu124

v0.2.68-metal

v0.2.69

v0.2.69-cu121

v0.2.69-cu122

v0.2.69-cu123

v0.2.69-cu124

v0.2.69-metal

v0.2.7

v0.2.70

v0.2.70-cu121

v0.2.70-cu122

v0.2.70-cu123

v0.2.70-cu124

v0.2.70-metal

v0.2.71

v0.2.71-cu121

v0.2.71-cu122

v0.2.71-cu123

v0.2.71-cu124

v0.2.71-metal

v0.2.72

v0.2.72-cu121

v0.2.72-cu122

v0.2.72-cu123

v0.2.72-cu124

v0.2.72-metal

v0.2.73

v0.2.73-cu121

v0.2.73-cu122

v0.2.73-cu123

v0.2.73-cu124

v0.2.73-metal

v0.2.74

v0.2.74-cu121

v0.2.74-cu122

v0.2.74-cu123

v0.2.74-cu124

v0.2.74-metal

v0.2.75

v0.2.75-cu121

v0.2.75-cu122

v0.2.75-cu123

v0.2.75-cu124

v0.2.75-metal

v0.2.76

v0.2.76-cu121

v0.2.76-cu122

v0.2.76-cu123

v0.2.76-cu124

v0.2.76-metal

v0.2.77

v0.2.77-cu121

v0.2.77-cu122

v0.2.77-cu123

v0.2.77-cu124

v0.2.77-metal

v0.2.78

v0.2.78-metal

v0.2.79

v0.2.79-metal

v0.2.8

v0.2.80

v0.2.80-metal

v0.2.81

v0.2.81-cu121

v0.2.81-cu122

v0.2.81-cu123

v0.2.81-cu124

v0.2.81-metal

v0.2.82

v0.2.82-cu121

v0.2.82-cu122

v0.2.82-cu123

v0.2.82-cu124

v0.2.82-metal

v0.2.83

v0.2.83-cu121

v0.2.83-cu122

v0.2.83-cu123

v0.2.83-cu124

v0.2.83-metal

v0.2.84

v0.2.84-cu121

v0.2.84-cu122

v0.2.84-cu123

v0.2.84-cu124

v0.2.84-metal

v0.2.85

v0.2.85-cu121

v0.2.85-cu122

v0.2.85-cu123

v0.2.85-cu124

v0.2.85-metal

v0.2.86

v0.2.86-cu121

v0.2.86-cu122

v0.2.86-cu123

v0.2.86-cu124

v0.2.86-metal

v0.2.87

v0.2.87-cu121

v0.2.87-cu122

v0.2.87-cu123

v0.2.87-cu124

v0.2.87-metal

v0.2.88

v0.2.88-cu121

v0.2.88-cu122

v0.2.88-cu123

v0.2.88-cu124

v0.2.88-metal

v0.2.89

v0.2.89-cu121

v0.2.89-cu124

v0.2.89-metal

v0.2.9

v0.2.90

v0.2.90-cu121

v0.2.90-cu122

v0.2.90-cu123

v0.2.90-cu124

v0.2.90-metal

v0.3.0

v0.3.0-metal

v0.3.1

v0.3.1-metal

v0.3.10

v0.3.11

v0.3.11-metal

v0.3.12

v0.3.12-cu121

v0.3.12-cu122

v0.3.12-cu123

v0.3.12-cu124

v0.3.12-metal

v0.3.13

v0.3.13-cu121

v0.3.13-cu122

v0.3.13-cu123

v0.3.13-cu124

v0.3.13-metal

v0.3.14

v0.3.14-cu124

v0.3.14-metal

v0.3.15

v0.3.15-cu121

v0.3.15-cu122

v0.3.15-cu123

v0.3.15-cu124

v0.3.15-metal

v0.3.16

v0.3.16-cu121

v0.3.16-cu122

v0.3.16-cu123

v0.3.16-cu124

v0.3.16-metal

v0.3.17

v0.3.17-metal

v0.3.18

v0.3.18-cu121

v0.3.18-cu122

v0.3.18-cu123

v0.3.18-cu124

v0.3.18-metal

v0.3.19

v0.3.19-cu121

v0.3.19-cu122

v0.3.19-cu123

v0.3.19-cu124

v0.3.19-metal

v0.3.2

v0.3.2-metal

v0.3.3

v0.3.4

v0.3.4-cu121

v0.3.4-cu122

v0.3.4-cu123

v0.3.4-cu124

v0.3.4-metal

v0.3.5

v0.3.5-metal

v0.3.6

v0.3.7

v0.3.8

v0.3.9

7dbbfdecad fix: submodule kompute is not included in sdist. Closes #1165 Andrei Betlen 2024-02-13 23:53:56 -05:00
345215a76c fix: more chatml-function-calling fixes Andrei Betlen 2024-02-13 23:02:50 -05:00
b1637c2319 Bump version v0.2.42 Andrei Betlen 2024-02-13 12:35:04 -05:00
d6be5333e1 fix: sample idx off-by-one error for logit_processors (#1179) Andrew Lapp 2024-02-13 17:26:07 +00:00
f7cdf78788 Update llama.cpp Andrei Betlen 2024-02-13 12:24:00 -05:00
68fb71b6a2 fix: missing generation_prompt in chatml-function-calling Andrei Betlen 2024-02-13 03:24:41 -05:00
4b0e3320bd fix: minor formatting bugs for chatml-function-calling Andrei Betlen 2024-02-13 03:11:35 -05:00
6fe8b427e1 Bump version v0.2.41 Andrei Betlen 2024-02-13 02:46:52 -05:00
d1822fed6b fix: Don't change order of json schema object properties unless prop_order is passed, Closes #1180 Andrei Betlen 2024-02-13 02:44:00 -05:00
5efc45bdfd Update llama.cpp Andrei Betlen 2024-02-13 02:43:07 -05:00
4348a6cdf0 docs: Fix typo Andrei Betlen 2024-02-13 02:04:54 -05:00
d605875772 Bump version v0.2.40 Andrei Betlen 2024-02-12 16:28:30 -05:00
b82b0e1014 docs: Temporarily revert function calling docs Andrei Betlen 2024-02-12 16:27:43 -05:00
cb791716b4 fix: Always set logits_all = True when using speculative decoding Andrei Betlen 2024-02-12 16:19:05 -05:00
153a0049d9 feat: Generic chatml Function Calling (#957) Andrei 2024-02-12 15:56:07 -05:00
69413ce08e Update llama.cpp Andrei Betlen 2024-02-11 19:00:17 -05:00
9368670639 Update llama.cpp Andrei Betlen 2024-02-11 14:02:46 -05:00
a05d90446f fix: Circular dependancy preventing early Llama object free (#1176) Connor 2024-02-11 10:57:57 -08:00
918ff27e50 docs: Set the correct command for compiling with syscl support (#1172) Akarshan Biswas 2024-02-12 00:25:15 +05:30
19b55ad3e5 feat: use gpu backend for clip if available (#1175) Douglas Hanley 2024-02-11 12:53:59 -06:00
63b0c37836 Update llama.cpp Andrei Betlen 2024-02-09 13:36:58 -05:00
4abb8c9386 Merge branch 'main' of github.com:abetlen/llama_cpp_python into main Andrei Betlen 2024-02-09 13:32:31 -05:00
e16f06e6eb fix: revert _create_completions. Andrei Betlen 2024-02-09 02:02:13 -05:00
dfc1b17341 Update llama.cpp Andrei Betlen 2024-02-08 23:38:12 -05:00
5b4ad6c80b Merge branch 'main' of https://github.com/abetlen/llama-cpp-python into main Andrei Betlen 2024-02-08 23:34:45 -05:00
85d3374b4d fix: broken import Andrei Betlen 2024-02-08 01:13:28 -05:00
b5fca911b5 feat: Move tokenizer to own module Andrei Betlen 2024-02-08 01:08:18 -05:00
2ef7ba3aed misc: rename grammar test Andrei Betlen 2024-02-08 01:07:44 -05:00
901827013b feat: Integrate functionary v1.4 and v2 models + add custom tokenizer support to Llama class (#1078) Jeffrey Fong 2024-02-08 09:07:03 +08:00
ce12775490 Update llama.cpp Andrei Betlen 2024-02-06 18:50:56 -05:00
34f31040f6 Bump version v0.2.39 Andrei Betlen 2024-02-06 12:47:59 -05:00
5e3e67af47 Update llama.cpp Andrei Betlen 2024-02-06 12:44:07 -05:00
310fbf4e49 Update llama.cpp Andrei Betlen 2024-02-05 22:07:14 -05:00
59760c85ed fix: Use llama_log_callback to avoid suppress_stdout_stderr Andrei Betlen 2024-02-05 21:52:12 -05:00
3553b14670 Update llama.cpp Andrei Betlen 2024-02-05 13:26:50 -05:00
7467f129e5 Revert "Fix: fileno error google colab (#729) (#1156)" (#1157) Andrei 2024-02-02 12:18:55 -05:00
bebfba0f08 Fix: fileno error google colab (#729) (#1156) Dulsara 2024-02-02 22:35:46 +05:30
8a5911bd5d Update llama.cpp Andrei Betlen 2024-02-02 09:41:27 -05:00
de526d0214 Update llama.cpp Andrei Betlen 2024-02-01 12:35:31 -05:00
3322eadbf3 Bump version v0.2.38 Andrei Betlen 2024-01-31 15:10:18 -05:00
a8cb34eacd Update llama.cpp Andrei Betlen 2024-01-31 15:05:51 -05:00
7a9f63959d Test dummy image tags in chat templates Andrei Betlen 2024-01-31 14:13:05 -05:00
fb762a6041 Add speculative decoding (#1120) Andrei 2024-01-31 14:08:14 -05:00
71e3e4c435 Update llama.cpp Andrei Betlen 2024-01-31 10:41:42 -05:00
2b37d8e438 fix: Run server command. Closes #1143 Andrei Betlen 2024-01-31 10:37:19 -05:00
078cca0361 fix: Pass raise_exception and add_generation_prompt to jinja2 chat template Andrei Betlen 2024-01-31 08:42:21 -05:00
411494706a Update llama.cpp Andrei Betlen 2024-01-31 08:35:21 -05:00
bf9e824922 Bump version v0.2.37 Andrei Betlen 2024-01-30 12:27:27 -05:00
247a16de66 docs: Update README Andrei Betlen 2024-01-30 12:23:07 -05:00
13b7ced7da Update llama.cpp Andrei Betlen 2024-01-30 12:21:41 -05:00
011cd84ded Update llama.cpp Andrei Betlen 2024-01-30 09:48:09 -05:00
da003d8768 Automatically set chat format from gguf (#1110) Andrei 2024-01-29 14:22:23 -05:00
059f6b3ac8 docs: fix typos Andrei Betlen 2024-01-29 11:02:25 -05:00
843e77e3e2 docs: Add Vulkan build instructions Andrei Betlen 2024-01-29 11:01:26 -05:00
464af5b39f Bump version v0.2.36 Andrei Betlen 2024-01-29 10:46:04 -05:00
9f7852acfa misc: Add vulkan target Andrei Betlen 2024-01-29 10:39:23 -05:00
85f8c4c06e Update llama.cpp Andrei Betlen 2024-01-29 10:39:08 -05:00
9ae5819ee4 Add chat format test. Andrei Betlen 2024-01-29 00:59:01 -05:00
ce38dbdf07 Add mistral instruct chat format as "mistral-instruct" (#799) Rafaelblsilva 2024-01-29 02:34:42 -03:00
52c4a84faf Bump version v0.2.35 Andrei Betlen 2024-01-28 19:35:37 -05:00
31e0288a41 Update llama.cpp Andrei Betlen 2024-01-28 19:34:27 -05:00
ccf4908bfd Update llama.cpp Andrei Betlen 2024-01-28 12:55:32 -05:00
8c59210062 docs: Fix typo Andrei Betlen 2024-01-27 19:37:59 -05:00
399fa1e03b docs: Add JSON and JSON schema mode examples to README Andrei Betlen 2024-01-27 19:36:33 -05:00
c1d0fff8a9 Bump version v0.2.34 Andrei Betlen 2024-01-27 18:36:56 -05:00
d8f6914f45 Add json schema mode (#1122) Andrei 2024-01-27 16:52:18 -05:00
c6d3bd62e8 Update llama.cpp Andrei Betlen 2024-01-27 16:22:46 -05:00
35918873b4 Update llama.cpp Andrei Betlen 2024-01-26 11:45:48 -05:00
f5cc6b3053 Bump version v0.2.33 Andrei Betlen 2024-01-25 11:28:16 -05:00
cde7514c3d feat(server): include llama-cpp-python version in openapi spec Andrei Betlen 2024-01-25 11:23:18 -05:00
2588f34a22 Update llama.cpp Andrei Betlen 2024-01-25 11:22:42 -05:00
dc5a436224 Update llama.cpp Andrei Betlen 2024-01-25 11:19:34 -05:00
d6fb16e055 docs: Update README Andrei Betlen 2024-01-25 10:51:48 -05:00
5b258bf840 docs: Update README with more param common examples Andrei Betlen 2024-01-24 10:51:15 -05:00
c343baaba8 Update llama.cpp Andrei Betlen 2024-01-24 10:40:50 -05:00
c970d41a85 fix: llama_log_set should be able to accept null pointer Andrei Betlen 2024-01-24 10:38:30 -05:00
9677a1f2c8 fix: Check order Andrei Betlen 2024-01-23 22:28:03 -05:00
4d6b2f7b91 fix: format Andrei Betlen 2024-01-23 22:08:27 -05:00
fe5d6ea648 fix: GGUF metadata KV overrides, re #1011 (#1116) Phil H 2024-01-24 03:00:38 +00:00
7e63928bc9 Update llama.cpp Andrei Betlen 2024-01-23 18:42:39 -05:00
fcdf337d84 Update llama.cpp Andrei Betlen 2024-01-22 11:25:11 -05:00
5b982d0f8c fix: use both eos and bos tokens as stop sequences for hf-tokenizer-config chat format. Andrei Betlen 2024-01-22 08:32:48 -05:00
2ce0b8aa2c Bump version v0.2.32 Andrei Betlen 2024-01-21 20:30:24 -05:00
d3f5528ca8 fix: from_json_schema oneof/anyof bug. Closes #1097 Andrei Betlen 2024-01-21 19:06:53 -05:00
8eefdbca03 Update llama.cpp Andrei Betlen 2024-01-21 19:01:27 -05:00
88fbccaaa3 docs: Add macosx wrong arch fix to README Andrei Betlen 2024-01-21 18:38:44 -05:00
24f39454e9 fix: pass chat handler not chat formatter for huggingface autotokenizer and tokenizer_config formats. Andrei Betlen 2024-01-21 18:38:04 -05:00
7f3209b1eb feat: Add add_generation_prompt option for jinja2chatformatter. Andrei Betlen 2024-01-21 18:37:24 -05:00
ac2e96d4b4 Update llama.cpp Andrei Betlen 2024-01-19 15:33:43 -05:00
be09318c26 feat: Add Jinja2ChatFormatter Andrei Betlen 2024-01-19 15:04:42 -05:00
5a34c57e54 feat: Expose gguf model metadata in metadata property Andrei Betlen 2024-01-19 10:46:03 -05:00
833a7f1a86 Bump version v0.2.31 Andrei Betlen 2024-01-19 09:03:35 -05:00
e21c3c7a91 Update makefile Andrei Betlen 2024-01-19 08:47:56 -05:00
0f54948482 Update llama.cpp Andrei Betlen 2024-01-19 08:41:52 -05:00
3babe3512c Fix mirostat sampling Andrei Betlen 2024-01-19 08:31:59 -05:00
141293a75b Fix python3.8 support Andrei Betlen 2024-01-19 08:17:49 -05:00
656f3d8968 Bump version v0.2.30 Andrei Betlen 2024-01-18 21:30:36 -05:00
03ed547bfd Remove templates doc Andrei Betlen 2024-01-18 21:23:26 -05:00
3ca86ab390 Update llama.cpp Andrei Betlen 2024-01-18 21:22:45 -05:00
be23404ed4 Cleanup pyproject Andrei Betlen 2024-01-18 21:22:19 -05:00

... 6 7 8 9 10 ...