1. Конкурентный доступ по общей шине. От того, что память на процессоре, шина никуда не делась. Она есть даже на картинке.
2. Память используется "обычная", а не GDDR.
При не совсем корректном проектировании ПО конкурентный доступ к одному выделенному куску памяти несколькими потоками просто...