Haberler

GitHub, agent workflow’larında token harcamasını %62’ye kadar düşürdü

GitHub, agentic workflow’larda MCP tool pruning, CLI değişimi ve günlük audit agent’larıyla token harcamasını %62’ye kadar düşürdü.

GitHub, kendi repository’lerinde çalıştırdığı agentic workflow’lardaki token kullanımını ciddi oranda azalttığını açıkladı. Kullanılmayan MCP tool’larının budanması, MCP çağrılarının GitHub CLI komutlarıyla değiştirilmesi ve günlük audit ile optimizasyon agent’larının devreye alınmasıyla %62’ye varan düşüşler kaydedildi.

Bu çalışma, CI pipeline’larında LLM agent’ları çalıştıran tüm ekipleri ilgilendiriyor. Zamanlanmış job’lar sessizce maliyet biriktiriyor ve çoğu zaman kimse fark etmiyor.

Nasıl ölçüyorlar?

GitHub tüm agent çağrılarını bir API proxy üzerinden yönlendiriyor. Her çalıştırma için input, output ve cache token’larını yakalayan bir token-usage.jsonl artifact’ı yazılıyor. Bu format Claude CLI, Copilot CLI ve Codex CLI arasında normalize edilmiş durumda.

Farklı model tier’ları arasında karşılaştırma yapabilmek için Effective Tokens (ET) adında bir metrik kullanıyorlar. Output token’ları 4x, cache read’leri 0.1x ile ağırlıklandırılıyor, sonra model çarpanı uygulanıyor: Haiku 0.25x, Sonnet 1.0x, Opus 5.0x. ET’deki %10 düşüş, hangi model kullanılırsa kullanılsın %10 maliyet azalmasına denk geliyor.

İki agent’lı optimizasyon döngüsü

Optimizasyon iki agentic workflow üzerinden yürüyor. Daily Token Usage Auditor tüketimi workflow bazında topluyor, anormal çalıştırmaları işaretliyor ve en pahalı job’ları yüzeye çıkarıyor. Auditor bir workflow’u işaretlediğinde Daily Token Optimiser devreye giriyor: kaynak kodu ve son log’ları okuyor, GitHub issue açıyor ve spesifik düzeltmeler öneriyor. İki agent da kendi günlük raporlarında görünüyor, yani kendi maliyetlerini de izliyorlar.

En yaygın sorun: kullanılmayan MCP tool’ları

Optimiser’ın en sık bulduğu verimsizlik kullanılmayan MCP tool’ları. LLM API’leri stateless olduğu için agent runtime’ları her istekte tool schema’larını dahil ediyor. 40 tool’lu bir GitHub MCP server’ı her turn’de 10-15 KB schema ekleyebiliyor. Kullanılmayan girdileri kaldırmak, GitHub’ın smoke-test workflow’larında çağrı başına context’i 8-12 KB azaltmış.

Ekip ayrıca pull request diff’lerini ve dosya içeriklerini çekmek için yapılan MCP çağrılarını gh CLI komutlarıyla değiştirmiş. Dosyalar ya agent başlamadan önce workspace’e indiriliyor ya da çalışma zamanında transparent bir HTTP proxy üzerinden çekiliyor. Bu proxy authentication token’larını agent’tan uzak tutuyor.

Sonuçlar

Bir düzine production workflow’unda elde edilen sonuçlar şöyle: Auto-Triage Issues 109 düzeltme sonrası çalıştırmada sürekli %62 ET düşüşü göstermiş. Security Guard %43, Smoke Claude %59, Daily Community Attribution %37 azalma kaydetmiş. Contribution Check ise %5 artış göstermiş ama GitHub bunu daha büyük pull request’lere kayma olarak açıklıyor, bir regresyon değil.

MCP budamanın her zaman işe yaramadığını da belirtmişler. Daily Community Attribution sekiz kullanılmayan GitHub MCP tool’u taşıyordu ve tüm çalıştırma boyunca bunlara sıfır çağrı yapıyordu. Ama kaldırmak ET’yi düşürmedi. Tool manifest’leri bu workflow’un toplam context’inin küçük bir kısmıydı.

Audit-and-optimise döngüsü

Anthropic ve OpenAI prompt caching sunuyor, LangChain callback tabanlı token tracking sağlıyor. GitHub’ın katkısı proxy seviyesinde observability ile issue açan optimiser agent’ları birleştiren audit-and-optimise döngüsü. Auditor ve Optimiser gh-aw CLI’da bugün kullanılabilir durumda.

Bir sonraki adım olarak repository’deki tüm workflow’lar arasında tekrarlanan read’leri ve paylaşılan ara artifact’ları hedefleyen portföy seviyesinde analiz planlanıyor.


GitHub’ın bu çalışması, agent workflow’larının maliyetini düşürme konusunda somut ve ölçülebilir sonuçlar ortaya koyuyor. MCP tool schema’larının her istekte gönderilmesi düşünüldüğünde, kullanılmayan tool’ları budamanın etkisi mantıklı. Ama asıl değerli kısım günlük audit ve optimizasyon döngüsü. Token harcamasını bir kere optimize edip bırakmak yerine, sürekli izleyen ve issue açan agent’lar devreye almak, özellikle çok sayıda workflow çalıştıran ekipler için pratik bir yaklaşım.

Kaynak: https://www.infoq.com/news/2026/05/github-agentic-token-savings/

Yazar Hakkında

Kerem Şuğle

Solution Architect

Leave a Comment