Yeniden AI
ChatGPT ilk çıkmasındaki beklenti fırtınası dindi. Artık bu teknoloji ile ne yapılıp ne yapılamayacağını daha iyi anlamaya başladık.
Lütfen abone olun; lütfen paylaşın.
Abonelik bedava. Reklam falan da yok burada. Yani bana para getirmeyecek ama abone olarak şevkimi arttıracaksınız. Manevi desteğinizi esirgemeyin.
-+-+-+-+
Yeni inovasyonların çoğu, şu beş aşamadan geçer:
Coşku, heyecan ve yüksek beklentilerle başlanır,
Beklentiler zirve yapar ama henüz sonuç yoktur ortada,
Şişirilmiş beklentiler karşılanamaz, karamsarlık ve hayal kırıklığı olur,
Karamsarlıktan teknoloji potansiyellerini ve sınırlamalarını öğrenerek çıkarız,
Son durak, benim Yeni Normal dediğim aşama olur. Yeni teknoloji yararlı sonuçlar üretmeye başlar. Bir takım sonuçlar çıkmaya başlar. Bunlar ilk beklentilerin çok altında da kalmış olsalar, hayat kolaylaşır. Geçmiş unutulur ve bu yeni normalle yaşamaya başlarız.
Bu süreç Gartner Hype Döngüsü olarak da bilinir.
Büyük Dil Modelleri (LLM) hakkındaki beklentiler geçen sene zirve yapmıştı. Şimdi yokuş aşağı iniyoruz. Hayaller küçülürken, felaket tellalları da yavaşladı. İki günde bir YouTube ‘da Yuval Harari’yi kıyamet günü yaklaştı diye sızlanırken görürdüm, artık çıkmıyor sanki.
Firmalardan ‘müjde’ler gelmeye devam ediyor ama duyunca geçen yıl olduğu gibi yüreklerimiz hoplamıyor artık. Örneğin, OpenAI geçen hafta üstün muhakeme yeteneğine sahip olduğu söylenen Strawberry diye adlandırdığı yeni bir modelin yakında piyasaya sürüleceğini duyurdu. Şirket içi adı Q* olan bu modeli belki geçen yıldan hatırlarsınız. OpenAI CEO'su Altman Yönetim Kurulu tarafından görevden alındığında, bazı yorumcular bunu yeni geliştirilen yapay zeka Q* hakkındaki görüş farklılıklarına bağlamıştılar. Bu yorumculara göre, bazı yönetim kurulu üyeleri Q’ nün dünyayı ele geçirme tehlikesine karşı Altman’ın çok lakayt kaldığını düşünüyorlardı. Bugün OpenAI, işte o tehlikeli modelin piyasaya çıkmak üzere olduğunu duyurdu, kamuoyu ırgalamadı bile. Bu gelişmeleri yakından izleyenler dışında kimsenin haberi bile olmadı.
Hayal kırıklığı biraz "killer app" dediğimiz uygulamaların henüz çıkmamasından bence. ChatGPT kendisi killer App idi ama esas heyecan, bu böyle ise ileride ne olur diyeydi ama gerisi gelmedi. Niş alanlarda faydalı uygulamalar var ama başlangıçta vaad edilen büyüleyici uygulamalardan hiç birini henüz görebilmiş değiliz.
Ben, ChatGPT ilk çıktığında iyi şeyler umuyordum ama umutlarımda gerçekçi idim. 24 Mart 2023 tarihli yazımdan kopyalıyorum::
Bilgisayar programları… mühendisler gibi konuşmayı ve yazmayı öğrenir ama mühendisler gibi hesaplayamaz… Sadece transformatör tekniğini kullanarak Büyük Dil Modelleri mühendis olamaz ama mühendislik görevi için gerekli programları çalıştırmayı öğrenebilirler.
Bu gerçekleştiğinde, ortaya çıkan şey herşeye kadir Genel Yapay Zeka olmayacak ama insan mühendislerin daha iyi ürünler yaratmasına çok yardımı olacak.
Aşağı yukarı hâlâ aynı fikirdeyim.
Büyük dil modelleri (LLM) kullanarak makina mühendisliği ders kitabı çabalarımı hatırlayın: OpenAI API'yi kullanarak embeddings, retrievals, ve blog yazılarımdaki soruları yanıtlayan bir sohbet robotu. OpenAI API portalının istikrarsızlığı ve hataları yüzünden o kulvardan daha fazla devam etmeme kararı aldım. ChatGPT mükemmel bir ürün ve OpenAI için övünç duyulacak bir başarı ama aynı OpenAI’nın API'si farklı bir şirket tarafından yönetiliyor gibi görünüyor.
Llama
Yan Le Cun (Meta Başkan Yardımcısı ve Baş Yapay Zeka Bilimcisi), BDM ile Yapay Zeka’ya ulaşılamayacağına inananlardan biri ve teknik olarak bu konuda en yetkin insanlardan biri olarak kabul edildiği için onun görüşlerinin ayrı bir ağırlığı var. Zuckerberg’i de bu konuda ikna etmiş olmalı ki güçlü LLM'ler geliştirip open-source olarak kamu oyuna sunuyorlar. İyilik yap denize at misali değil, sanırım bunu OpenAI ve Anthropy gibi şirketlerin yalnız bırakılırlarsa bu konuya duyulan kamuoyu ilgisini istismar ederek zenginleşip başka alanlarda Facebook'un gelecekteki rakipleri haline gelmelerini önlemek için yapıyorlar.
Bundan sonrası biraz teknikleşiyor. Türkçeye çevirmek zor olacak. Zaten sadece bu konuda program yazmaya çalışanları ilgilendirecek şeyler. KISA KISA bölümünde Türkçeye dönüyorum.
Llama 3.1 is their latest release. Using langchain
and Ollama
, I am able to run Llama 3.1 model Meta-Llama-3-8B
on my Mac M1 computer. The model has 8 billion parameters, a context length of 8192 and an embedding vector size of 4096. At the moment, I am trying to write a program to use it to query my blog posts. I did this using the OpenAI API but one needs to pay OpenAI every time a call is made. This is not expensive when developing software but could be prohibitive for the users if I manage to develop it to product level.
Llama Performance
You may remember my post on asking Claude and ChatGPT about cantilever stresses.
Now I do the same with Llama 3.1. Remember, this is running on my local computer. I run it as a Jupyter notebook.
# !pip3 install langchain_community
# Import 0llama
from langchain_community.llms import Ollama
# Create a model instance
llm = Ollama(model="llama3")
# The prompt
query_text="To solve this problem, I want you to usethe Chain of Thoughts strategy. First, breakdown the problem into \
a series of steps, explaining your thought process at each step. Then provide the final answer.\n\n\
`A cantilever beam has a circular cross-section. Its diameter is 10 mm, What is its cross-sectional area?`"
s=llm.invoke(query_text) # Ask llama3
It took 25.2 s on my Mac M1 to produce the following answer:
I used the `md
` (markdown printing) function to print it. I then asked my next question:
follow_up="The length of this cantilever beam is 1m. A load of 100N is acting on its free end. What is the maximum stress caused in the beam?"
s=llm.invoke(follow_up)
md(s)
It took 37.4 s to produce the following response:
It obviously forgot the context of the first question. It assumed a rectangular beam. This is my fault, The context is maintained in ChatGPT and Claude by the API interface. Here, I have to it myself. So, I try again:
It is the wrong answer but you can see how it is trying. It is not too bad for a local model without using commercial servers. Remember, Anthropy’s Claude also failed to answer correctly this question.
I will continue working with llama.
Konuyu özetleyeyim. Genel Yapay Zeka dediğimiz şeye yani her konuda doğru muhakeme yürütüp yerinde sonuçlara varacak bir yazılıma yakın zamanda erişeceğimizi düşünmüyorum. Fakat, belirli alanlarda uygulayıcılara yardımcı olacak yapay zeka araçlarımız, LLM ler kategorik bilgi ile olasılı bilgiyi ayırt etmeyi öğrendikleri zaman piyasaya çıkar sanıyorum. Bunlardan bazıları dizüstü bilgisayarlarınızda veya akıllı telefonlarınızda yerel olarak çalışan araçlar olacaktır. Geçen yıl söylediğim gibi ve Microsoft'tan sürekli duyduğuma göre (blogumu takip ediyor olmalılar), bu amaca doğru ihtiyacımız olan tek şey LLM için ders kitapları üretilmesi.
Son olarak, bu konuları ilk tanıtıldığında ChatGPT ile tartışmıştım. Aynı konuşmayı yeni ve daha güçlü GPT-4o ile de yapayım dedim. Dipnot olarak bu postanın ingilizce versiyonunda dip not olarak bulabilirsiniz1.
Not: Bu yazıyı tamamlarken Çin şirketi Alibaba piyasaya Qwen2-VL'yi takdim etti. İnsanlar bazı kıyaslamalarda GPT-4o'dan daha iyi olduğunu söylüyor.
Kısa Kısa
Aşikar İmtiyaz
Adrian Tout'un haber bülteninin 11 Şubat 2024 sayısında okudum bunu. ABD ekonomisi (Reel GSYİH ile ölçüldüğünde) dünyanın toplam ekonomik üretiminin %18'inden azını temsil ederken, ABD borsası küresel piyasa kapitalizasyonunun yaklaşık %70'ini oluşturuyormuş. Bu çok ilginç bir veri. Yani, dünya borsa yatırımcıları, ABD firmalarına yatırılan paranın dünyanın diğer borsalarına göre üç misli daha fazla getirisi olacağına inanıyorlar.2.
Nedeni fiyatları çok yükselen teknoloji stokları olabilir mi? Grafik, ABD'nin en büyük 7 teknoloji hissesinin diğerlerinden nasıl farklı bir yolda olduğunu gösteriyor:
ABD hisse senedi fiyatlarının diğerlerine göre daha pahalı olmasının bir diğer nedeni de risk algısı olabilir. ABD hisselerini satın alan kişiler, başka bir ülkenin ABD ekonomisine ve ABD hisse piyasasına zarar verecek eylemlerde bulunmasının zor olduğuna, ancak bunun tersinin geçerli olmadığına inandıkları için bir risk primi ödüyor olabilirler.
EGS Yeniden
İki ABD şirketi Sage Geosystems ve Fervo Energy, EGS umutlarını ABD'de canlandırdı tekrar. Sage Geosystems, Meta sunucularına güç sağlayacak 150 MWe'lik bir jeotermal tesis kuracak. Fervo ise Güney Kaliforniya Edison ile 2028'e kadar 320 MW'a kadar elektrik sağlayacak anlaşmalar imzaladı. Bu iki projenin başarılı olması EGS jeotermaline olan ilginin yeniden başlayacağı anlamına gelebilir.
EGS, Enhanced Geothermal Systems yani Geliştirilmiş Jeotermal Sistemler anlamına geliyor. Buna derin jeotermal de diyebilirsiniz. 3000 m ve daha derinlere inildiğinde dünyanın hemen her yerinde bulunabilecek sıcak kuru kayalardaki ısıyı uygun fiyata yüzeye çıkarabilirseniz enerji sorununu çözmüş olursunuz. EGS işte bunu yapmak demek. Daha fazlasını öğrenmek istiyorsanız 2013 yılında The Conversation için yazdığım bu makalede var. Orada yazdığım her şey hala geçerli. O zamanlar Avustralya'da bu ısıyı uygun bir fiyata yüzeye çıkarmanın bir yolunu bulamadık. Sage Geosystems ve Fervo Energy şimdi bunu başarıyor olabilir. Bu nedenle deneyimlerini dikkatle izlemek gerekiyor.
Copper String maliyet patlaması
Avustralya hükümetleri Copper String projesini yirmi yıl önce tartışmaya başladı. Fikir, Mt Isa-Cloncurry madencilik bölgesini Doğu Avustralya Enerji Şebekesine (NEM ağı) bağlamaktı.
İşte bazı parametreler:
Uzunluk = Townsvill'den Isa Dağı'na kadar olan iletim hattının uzunluğu 840 km'dir. Yeni jeneratörleri Copper String'e bağlamak için ilave 200 km'lik bir yol daha inşa edilecek.
İletim Kapasitesi = Maksimum iletim kapasitesi hiçbir belgede belirtilmediği gibi hattın mevcut kapasitesi de belirtilmemiş. Yüksek gerilim hatları için genel tipik değerler 1000 ile 5000 Amper arasında değişebilir. Akım taşıma kapasitesini sınırlayan şey genellikle hat sıcaklığıdır. Kuzey Queensland sıcak olduğu için, 2000 A'nın altında bir değer bekliyorum. Bu da yaklaşık 1000 MWe iletim kapasitesi anlamına geliyor.
Maliyet = Orijinal tahmin 4 milyar dolardı ve geçen hafta bunun 5,2 milyar dolara mal olacağını öğrendik. İnşaat henüz başlamadı. Daha da yükselebilir.
Avustralya'da tüm inşaatlar neden bu kadar pahalı?
Tahmin edilen Copper String maliyeti kilometre başına 5200 $/MWe. Benim 8 Temmuz 2024 postasında Sincan'dan Anhui'ye çekilen Çin'in 12 GW UHVDC hattı için bildirdiğim birim fiyatın misliyle üstünde. Çin’deki hattın maliyeti kilometre başına 150 ABD Doları/MW idi, yani yaklaşık 200 AUD/MWe/km. Elmayla elmayı karşılaştırmadığımı biliyorum. Uzun AC hatları için birim maliyetin daha yüksek olması normaldir; ayrıca Çin’deki daha yüksek taşıma kapasitesi birim maliyeti düşürecektir. Bütün bu faktörlere rağmen, Avustralya'da iletim hatları inşa etmenin maliyeti Çin'dekinden çok daha yüksek görünüyor.
Günlük
Yürüyüş Sırt Çantam
Haftada üç gün yüklü sırt çantası ile yürüyüş yapıyorum. Sağlık Sohbetinde yazdım nedenini. Taylan'ın tavsiyesi üzerine sırtımı korumak için uygun (yani pahalı) bir sırt çantası aldım. Şu anda çok doldurmuyorum. Çanta ile birlikte tartınca 12,5 kg ama bir saatlik yürüyüşten sonra sanki iki kat ağırlaşmış gibi geliyor:
bu da arkadan:
Sunny Park İnşaatı
Geçen Kasım’da başladım izlemeye yakında bir alışveriş merkezinde oto parka kazılan çukurla başlayan inşaatı. Şubat ayında, hâlâ bir inşaat alanıydı. Bugünlerde, nihayet, artık tamamlanmaya yakın olduğunu düşünüyorum. Geçen hafta durum şöyle idi:
Orijinaline kıyasla pek bir şey değişmemiş gibi görünmezken ordan buraya gelmesi bir yıl sürdü.
Kampüs İnşaatı
Amfitiyatronun tamamlanmasıyla birlikte göller bölgesindeki inşaat da nihayet sona erdi:
Pascal Hagi
Uyumadan önce Spotify'da Paz dinliyorlar. 15 dakikalığına odadan çıktım ve geri döndüğümde kafeslerinde uyuyorlardı.
Okuduğum Kitaplar
Still Life, Louise Penny
Jeremy Anderberg'in Substack blogunda okumasam Louise Penny'den haberim yoktu. Still Life onun 2005 yılında yazdığı ilk kitap. Bu ilk kitabın ve sanırım sonraki kitaplarının da geçtiği yer Three Pines adında, Montreal'den yaklaşık iki saat uzakta, hayali küçük bir Anglofon kasabası. Kanada’nın en ilginç insanlarını kendisine çeken bir cazibesi var gibi görünüyor. Avustralya’lı okurlar, aynı büyüklükte ilginç bir kasaba olan Melbourne yakınlarındaki Portsea gibi düşünebilir. Türkiye için belki Sapanca diyebiliriz ama Sapanca çok daha kalabalık bir yer.
Kitap, bir ay sonra yapılacak olan sanat yarışmasının tartışıldığı bir komite toplantısıyla başlıyor. Emekli bir öğretmen olan Jane Neal'dan gelen tablo biraz heyecan yaratıyor. Bir kaç gün sonra Jane Neal bir okla öldürülmüş olarak bulunuyor. Bu civarlar yay ve okla avlanmanın oldukça popüler olduğu ve bölge sakinlerinin çoğunun da uzman okçu olduğu bir bölge imiş. Av sezonunda gelen ziyaretçiler de var. Yani ihtimal çok. Daha fazla açık etmeyeyim. Bu arada, yay türleri ve okçuluğun diğer teknikleri hakkında çok şey öğrendim.
Her polis dizisinin iyi bir polisiye karaktere sahip olması gerekiyor. Louise Penny'nin dedektifi, aslen Fransız Kanadalı olan ama bize "bir Lordlar Kamarası asilzade üyesi gibi" İngilizce konuştuğu söylenen Başmüfettiş Gamache. Gamache bilge ve şefkatli bir adam. Modern polisiye romanlardaki tipik kahramanların çoğu gibi başarısız evliliklerden çıkmış, yalnız yaşayan ve içki sorunları yaşayan tiplerden biri değil. Fedakar bir eş, iyi bir ekip üyesi olduğunu anlıyoruz. Ekibine iyi bir akıl hocası olmaya çalışıyor ve ekip üyeleri de genellikle onu sevip sayıyor. Kiminiz pek can sıkıcı bir karaktermiş de diyebilir ama öyle değil. Bu ilk kitapta bile ilginç bir karakter olarak belirleşirken, bundan sonraki kitaplarda daha detaylandırılacağını umuyorum.
Agatha Christie, Bir Cep Dolu Çavdar
Agatha Christie'nin Miss Marple serisinin bir sonraki kitabı. Mutsuz bir ailedeki bazı cinayetler bir çocuk şarkısını anımsatıyor: "Altı penilik bir şarkı söyle/Bir cep dolusu çavdar/Dört ve yirmi karatavuk/Pişirilmiş turta.” Elbette mantıklı bir açıklaması var ve bu açıklamayı bulmak için Miss Marple'a ihtiyaç oluyor.
AT Index
Temmuz ayında, Avustralya (AU) ve Türkiye(TR) fiyatlarını karşılaştırmak için AT endeksi diye bir sepet yapmıştım. Bu sepet için 1 Eylül fiyat kıyaslaması aşağıda Türk Lirası olarak görünüyor. Döviz kuru, 1AUD=23.05TRY.
AT endeks grafiği aşağıda. Bu histogramdaki sütun yüksekliği, Avustralya fiyatlarının Türkiye fiyatlarına oranını gösteriyor. Eğer fiyatlar eşit olsaydı, sütun yüksekliği 1,00 olurdu. Bu hafta (1 Eylül günü) Avustralya fiyatları, Türkiye fiyatlarından %56 daha pahalı.
Kullandığım veri tabanı ve yazılımları github’dan indirebilirsiniz isterseniz.