Hal Terbaik dalam Hidup Jangan Skala

Kata kunci terbesar di bidang teknologi akan gagal karena tidak berkembang.

Karena kami cepat berinovasi dengan teknologi baru, kami harus ingat apakah inovasi kami praktis dan layak. Di dunia tempat kami menghitung pengguna dalam ribuan dan runtime dalam milidetik, lebih penting dari sebelumnya untuk memastikan skala teknologi baru.

Itulah mengapa mengejutkan bahwa tiga kata kunci terbesar dalam teknologi benar-benar gagal diukur.

Tentu saja, saya berbicara tentang tiga kategori yang nampaknya setiap berita teknologi masuk ke dalam jaman sekarang:

  1. Kecerdasan buatan
  2. Blockchain
  3. Mixed Reality (XR, AR / VR)

Tampaknya hampir semuanya menggunakan atau menambahkan ini, namun gila betapa menyakitkan (dan sama sekali tidak mungkin) untuk meningkatkan layanan ini.

Kami membutuhkan lebih banyak perangkat keras

Kelemahan pertama dan terpenting adalah perangkat keras. Bukan rahasia lagi bahwa persyaratan perangkat keras untuk teknologi meningkat secara eksponensial dari tahun ke tahun, baik dalam harga maupun spesifikasi. Ini secara efektif menjadi faktor penghambat dalam adopsi yang meluas, dan dalam kasus blockchain, itu adalah pembunuh.

Blockchain biasanya bergantung pada "penambang" yang "milikku" memblokir dan memungkinkan jaringan untuk melakukan tugas yang paling mendasar (mis., Memverifikasi transaksi). Proses "menambang" adalah sesuatu yang tidak akan saya bahas secara mendalam, tetapi melibatkan pelaksanaan fungsi kriptografis yang besar, proses yang dikenal sebagai "hashing."

Masalah dengan hashing adalah ia membutuhkan sejumlah besar daya komputasi; pada kenyataannya, sejumlah besar yang secara efisien menambang di blockchain membutuhkan perangkat keras khusus, baik GPU atau ASIC. Untuk menjadi penambang terkecil, Anda akan membutuhkan GPU spesifikasi tinggi (mari kita nyata, Intel HD Graphics adalah standar konsumen saat ini sehingga pada dasarnya setiap GPU di atas yang berspesifikasi tinggi) atau ASIC khusus. Ini menghasilkan tagihan yang cukup besar, dengan sebagian besar perangkat dihargai ratusan hingga ribuan dolar per unit, tidak termasuk penggunaan listrik yang tinggi yang dianggap sebagai biaya operasi.

kekurangan GPU yang luar biasa di tahun 2018

Ini telah menjadi faktor pemblokiran yang signifikan dalam adopsi blockchain. Bahkan, karena alasan inilah, harga GPU melejit, dan stok semuanya menghilang, meninggalkan calon penambang tanpa alat apa pun, menabrak industri game PC dan menghambat para peneliti untuk mendapatkan akses ke perangkat keras kelas atas. Bahkan pabrikan GPU seperti Nvidia yang mendapat untung dari kenaikan ini akhirnya berbicara tentang kekurangan parah sebagai penyebab langsung blockchain.

Setahun kemudian, sebagian besar teknologi blockchain ini telah menghilang, dan harga cryptocurrency utama telah jatuh ke seperempat dari penilaian mereka. Perhatian yang paling banyak dinyatakan dengan blockchain adalah kegagalannya untuk skala, dan perangkat keras tetap (dan akan terus menjadi) faktor pemblokiran dalam penskalaan teknologi blockchain.

Namun, masalah ini tidak terbatas pada blockchain. Inteligensi buatan bergantung pada perangkat keras yang sama (GPU), dan ini menjadi faktor pemblokiran di bidang itu juga; kebanyakan startup yang akan datang tidak mampu membangun pertanian GPU yang sangat besar seperti Google, dan membeli daya komputasi dari penyedia cloud seperti AWS datang dengan kenaikan harga 4x yang menghasilkan tagihan server yang sangat besar.

Dengan XR, masalah ini bahkan lebih jengkel. Untuk menjalankan pengalaman ini, konsumen harus membuat visual, dan perangkat konsumen harus memproses input sensorik. Ini menempatkan sebagian besar beban pada konsumen, yang terdengar bagus untuk bisnis yang ingin masuk ke ruang XR tetapi menyebabkan masalah besar dengan penskalaan.

Sebagai contoh, mari kita ambil Oculus VR. Oculus adalah salah satu headset VR pertama yang diluncurkan dan tetap menjadi nama populer di lapangan, sejak diakuisisi oleh Facebook dan memperkuat posisi mereka di pasar.

“Spec minimum” yang sangat tinggi untuk Oculus; USB 3.0, GPU Nvidia yang bagus, RAM 8GB ...

Sayangnya, Oculus hampir secara eksklusif beroperasi pada PC desktop, apalagi membutuhkan spesifikasi GPU tinggi. Menghadapi perangkap yang sama dengan blockchain dan AI, tetapi dengan keprihatinan yang jauh lebih besar: sedangkan dengan AI bisnis hanya bisa membuang uang di infrastruktur mereka untuk sementara menyelesaikan masalah, dengan XR beban jatuh pada konsumen. Siklus adopsi AR / VR bergantung pada GPU konsumen untuk menjadi spesifikasi yang lebih luas dan lebih tinggi, serta menunggu harga turun ke tingkat yang terjangkau bagi pengguna rata-rata. Ini adalah proses yang berpotensi memakan waktu puluhan tahun - sementara CEO Nvidia Jensen Huang menyatakan bahwa hukum Moore mendukung GPU, waktu yang diperlukan untuk pengembangan yang cukup diperlukan untuk meningkatkan spesifikasi sementara menurunkan harga masih berarti beberapa tahun.

Untuk tiga kata kunci terbesar dalam teknologi, ini adalah kalimat yang memberatkan.

Runtime

Ketika kita berbicara tentang waktu eksekusi dalam komputasi, umumnya kita maksud dalam milidetik, karena pengguna telah tumbuh untuk mengharapkan interaksi instan.

Sayangnya, ini tidak terjadi sama sekali dengan ketiga teknologi di atas.

Dengan blockchain, menambang satu blok akan lebih lama dan lebih lama seiring berjalannya waktu. Sudah sampai pada titik di mana tidak lagi menguntungkan bagi individu untuk menambang cryptocurrency besar, dan kolam penambangan sudah mulai memanggil tembakan di jaringan. Untuk teknologi "desentralisasi", ia mendukung banyak sentralisasi.

Ini juga berarti malapetaka untuk kasus penggunaan terbesar blockchain: cryptocurrency. Cryptocurrency tumbuh subur dalam transaksi cepat, tanpa otoritas terpusat, lintas batas, dan tanpa biaya besar.

Namun, dengan kegagalan blockchain untuk skala dan jumlah waktu (waktu = listrik) yang diperlukan untuk menambang blok, biaya yang terkait dengan transaksi naik ke rekor tertinggi; pada puncaknya, Bitcoin mencapai titik di mana biaya yang terkait dengan sebagian besar transaksi kecil lebih besar daripada biaya transaksi aktual, menjadikannya sama sekali tidak berguna dan kegagalan total bagi konsumen sehari-hari. Transaksi mulai memakan waktu berjam-jam, dan peraturan karena pelarian, kenaikan harga Bitcoin membuatnya sulit untuk memindahkan Bitcoin melintasi batas.

Cryptocurrency menjadi segalanya yang dijanjikan untuk dihancurkan.

Dengan kecerdasan buatan, muncul masalah yang sangat berbeda. Waktu inferensi untuk banyak model skala besar membutuhkan beberapa detik, yang kedengarannya seperti sedikit waktu tetapi mulai meningkat dan menjadi sosok penghalang ketika membahas basis pengguna yang jumlahnya ribuan.

Selain itu, angka-angka yang dikutip untuk waktu inferensi dari sebagian besar model rumit - Anda harus membaca yang tersirat, atau lebih tepatnya ke baris berikutnya yang biasanya berbunyi "seperti yang ditemukan pada tumpukan GPU XYZ kami," di mana "tumpukan GPU XYZ" biaya beberapa ribu dolar dan harus sepenuhnya didedikasikan untuk tugas inferensi tunggal.

Tumpukan TPU Google yang sering digunakan untuk melatih model mereka

Tentu saja, penelitian sedang dilakukan di sini, tetapi penelitian yang dilakukan hampir sepenuhnya berfokus pada waktu pelatihan, yang menurut saya tidak terlalu penting. Untuk pelatihan, seminggu bukan masalah besar - startup mana pun dapat meluangkan seminggu untuk melatih model yang akan menjadi landasan bisnis mereka.

Masalah yang lebih besar terletak pada kesimpulan. Pada tingkat akar, pelatihan membutuhkan inferensi - kesimpulan biasanya dikutip sebagai fase "maju" dari jaringan, dan ini harus terjadi dalam pelatihan sebelum latar belakang dilakukan. Namun, dalam pelatihan, semua data yang perlu disimpulkan tersedia di awal.

Dengan kata lain, seluruh kumpulan dapat diproses sekaligus (yaitu, 100-an gambar pada saat yang sama), karena penskalaan matematika - mengalikan matriks yang lebih besar dari beberapa matriks lebih efisien daripada mengalikan beberapa matriks dari 1 matriks (dengan kata lain , lebih efisien untuk melakukan lebih banyak sekaligus). Ini naik ke titik tertentu, mirip dengan gagasan penurunan hasil dalam ekonomi, tetapi tetap bahwa pelatihan batch memungkinkan kita untuk skala inferensi pada sejumlah besar data.

Sayangnya, dalam arti praktis, pemrosesan batch jarang terjadi.

Jarang model harus menjalankan inferensi pada 200 gambar sekaligus; lebih mungkin bahwa 200 gambar dikirimkan untuk inferensi dalam, katakanlah, satu menit. Akan ada hambatan besar dalam waktu inferensi per gambar; bahkan waktu kesimpulan, sepertiga detik (yang sangat cepat - itu adalah waktu yang dibanggakan oleh model tercepat, seperti model prediksi kalimat super-dioptimalkan Gmail) akan menghasilkan hanya 180 gambar yang diproses per menit. Bahkan pada beban kecil 200 / mnt, model gagal untuk menskalakan, dan untuk menilai simpanan yang sedang tumbuh contoh kedua harus dihasilkan untuk menyeimbangkan.

Ini adalah pil yang sulit untuk ditelan di dunia di mana beban besar diberikan; pada kenyataannya, Node's Express mendapat kecaman sebelumnya karena hanya mendukung beberapa ribu koneksi / detik, mirip dengan basis data NoSQL populer yang dikritik karena mengalami hambatan pada beberapa ribu transaksi / detik.

bendungan yang dijamin akan pecah

Ini adalah angka yang belum pernah terjadi di dunia AI, yang mengalami hambatan besar pada beberapa ratus per detik dalam hal kesimpulan terpisah pada satu contoh model, bahkan dengan optimasi paling canggih yang dapat Anda lakukan.

Dengan XR, ada masalah yang sangat, sangat berbeda. Masalahnya terletak pada pencelupan - untuk pencelupan dan menghindari lembah yang tidak biasa, interaksi harus terjadi, dan render harus menyesuaikan lebih cepat daripada yang dapat dirasakan manusia. Dengan kata lain, beberapa ratus milidetik tidak cukup cepat.

Dengan XR, kami mengukur berbagai hal dalam jumlah kecil milidetik. Kami mengukur latensi yang dapat diterima seperti di bawah ~ 20ms (angka yang tidak disetujui oleh banyak gamer, karena 100+ fps dan di bawah sepuluh ping dianggap normal untuk sebagian besar rig).

Itu adalah sosok yang tetap menjadi penghambat dan merupakan sosok yang tidak kita kenal; sementara teknologi XR berfokus secara intensif pada hal ini dan banyak terobosan telah dicapai dalam bidang ini dalam hal input dan rendering sensorik biasa, kami masih menghadapi masalah dalam hal interaksi; tepatnya, XR membuka berbagai kemungkinan interaksi baru yang tak terbatas yang hanya bisa diproses dengan sangat cepat oleh sebagian besar mesin.

Mesin Augmented Image ARCore seperti dipamerkan di Google I / O 2018

Selain itu, untuk menjalankan augmentasi gambar dengan sesuatu yang lebih rumit daripada homografi, latensi terlalu tinggi untuk dianggap “dapat diterima” oleh sebagian besar pengalaman. Yang tercepat yang kami uji sejauh ini adalah Gambar Augmented ARCore Google, yang menggunakan homografi (ada juga demo Augmented Faces yang sedikit lebih lambat dan memiliki latensi / kelambatan yang nyata).

Demo ARCore Augmented Faces

Ini masalah besar

Dalam dua tahun terakhir saja, jumlah kemajuan dalam ketiga bidang ini tidak dapat diatasi.

Di AI, kami melihat generasi bahasa alami melompat maju dengan GPT-2, yang mendapatkan reputasinya sebagai Imagenet NLP. Itu membuka dunia baru kemungkinan dengan pemrosesan teks. Kami juga melihat jaringan konvolusional dan GAN tumbuh untuk mengadopsi gambar 4k, dan kami memasuki era di mana AI dapat meniru gambar HD dan menghasilkan konten yang tampaknya dapat dipercaya oleh mata manusia.

Dengan blockchain, bidang ini menjadi tidak begitu keruh, dengan beberapa penarikan uang tunai berkurang dan membuat lebih banyak ruang untuk eksposur dengan platform yang ada. Steam telah tumbuh secara signifikan dalam setahun terakhir, bersama dengan Stellar dan penggunaan blockchain dalam teknologi reguler. JPMorgan, BofA, dan Facebook telah mengumumkan blockchain mereka dan blockchain yang diterapkan mengalami peningkatan dengan platform seperti DLive yang telah mulai menjadi arus utama (DLive baru-baru ini membentuk kemitraan dengan kepribadian terbesar Youtube dengan platform pencipta-pertamanya).

Di XR, kami telah melihat ponsel level XR dan AR menjadi kenyataan dengan banyak peningkatan pada ARCore. Menjadi mungkin untuk mengintegrasikan AI ke dalam XR dan mengembangkan pengalaman yang memungkinkan untuk beberapa tingkat interaksi manusia (kami belum berhubungan fisik dulu, tetapi ada proyek yang memungkinkan interaksi lainnya, seperti Fiddler AR).

Ini semua adalah bidang yang membawa dampak besar dan signifikan terhadap masa depan teknologi, dan di mana peradaban manusia akan berjalan secara keseluruhan. Ini adalah teknologi yang tidak berdampak pada ekonomi; mereka mendefinisikannya kembali; mereka tidak memengaruhi masyarakat dan interaksi; mereka merevitalisasi itu. Itu memungkinkan perombakan seluruh budaya kita, dan pada tingkat akar, itu disebut Revolusi Industri lain.

Untuk gerakan yang memiliki pengaruh besar pada masyarakat luas, sangat penting dan penting bahwa ia dapat berskala untuk mendukung publik dengan mudah. Sampai ini diimplementasikan, itu menghambat adopsi dan membentuk penghalang keras untuk masuk dalam hal inovasi di luar perusahaan besar.

Saya berharap dapat melihat lebih banyak inovasi dalam meningkatkan teknologi ini. Di Epic.ai, kami berfokus pada pengembangan aplikasi yang sangat bergantung pada AI dan blockchain - kami semua terlalu terbiasa dengan batasan penskalaan; itu adalah masalah yang akan kami kerjakan dengan berat selama beberapa tahun ke depan, dan masalah yang kami harap industri ini akan bersama-sama selesaikan.

Hei! Saya Tomer, seorang pengusaha, dan pembuat. Anda mungkin mengenal saya dari Mevee, Crane, dan Shots, Slides, dan sekarang investorintelligence.io di antara produk lain yang telah saya luncurkan! Artikel ini adalah bagian dari seri yang lebih luas yang saya tulis sebagian besar berdasarkan pengalaman saya dan terutama dibuat dari pendapat saya dan tim saya.

Saya harap ini membantu Anda untuk menghindari kesalahan yang sama yang saya lakukan, dan ingat untuk tetap mengirim!

Silakan bertepuk tangan jika Anda menemukan ini berharga, dan ikuti saya untuk lebih banyak menulis seperti ini ketika saya berbagi cerita tentang seperti apa pengembangan perangkat lunak dan wirausaha dalam kehidupan nyata.

Kisah ini diterbitkan di The Startup, publikasi kewirausahaan terbesar Menengah diikuti oleh +442.678 orang.

Berlangganan untuk menerima berita utama kami di sini.