Data rhesymol fawr / Reasonably big data, 2015-11-17, 13:00

CODAH-SU-logo-24-300x94

CODAH – Centre on Digital Arts and Humanities
CODAH – Canolfan y Celfyddydau a’r Dyniaethau Digidol

Reasonably Big Data – #DataRhesymolFawr
SURF Room, Fulton House, Singleton Campus
1pm, Tuesday 17th November

Dr Rhys Jones: Department of Languages, Translation and Communication, Swansea University/Adran Ieithoedd, Cyfieithu a Chyfathrebu, Prifysgol Abertawe
Dr Daniel Cunliffe: Faculty of Computing, Engineering and Science, University of South Wales/Cyfadran Cyfrifiadureg, Peirianneg a Gwyddoniaeth, Prifysgol De Cymru

Traddodir y sgwrs trwy gyfrwng y Saesneg – This talk will be given in English

We outline our work in progress on the use of Twitter by the political parties who contested the 2014 European and 2015 UK general elections in Wales. We build on our existing work (Cunliffe, 2008, 2011) which examined the relative levels of Welsh-language provision on party websites during the 2007 Welsh Assembly and 2010 UK elections, and bring to it our previous research (Jones, Cunliffe and Honeycutt, 2013) on Twitter and the Welsh language.

However, this will mainly be a talk about the challenges of ‘data rhesymol fawr’, or, in English, ‘reasonably big data’. We now have a corpus of over 40,000 tweets from 12 political parties, and we will outline the challenges we face in analysis and discuss possible methodologies for constructing and discovering meaning in what we have collected.

Byddwn yn amlinellu ein gwaith ar-y-gweill ar y defnydd o Twitter gan y pleidiau gwleidyddol hynny a ymladdodd, yng Nghymru, yr etholiadau Ewropeaidd yn 2014 ac etholiad cyffredinol y DU yn 2015. Mae hyn yn adeiladu ar ben ein gwaith blaenorol (Cunliffe, 2008, 2011) a archwiliodd y lefelau cymharol o ddarpariaeth Gymraeg ar wefannau’r pleidiau yn ystod etholiad y Cynulliad 2007 ac etholiadau’r DU yn 2010. Byddwn hefyd yn ymwneud â’n gwaith ymchwil blaenorol (Jones, Cunliffe a Honeycutt, 2013) ar gydberthynas Twitter a’r iaith Gymraeg.

Bydd y sgwrs hon, fodd bynnag, yn bennaf yn trafod heriau ‘data rhesymol fawr’. Mae gennym bellach gorpws o dros 40,000 o negeseuon trydar gan 12 plaid wleidyddol, a byddwn yn amlinellu’r heriau o ddadansoddi, ac yn trafod methodolegau posibl ar gyfer adeiladu a darganfod ystyr yn yr hyn yr ydym wedi ei gasglu.

Heno, chwarter canrif yn ôl…

Mae canol Medi’n gyfnod aruthrol o brysur i rywun fel fi, felly prin iawn o amser sydd gyda fi i wneud cyfiawnhad â chwarter canrif o Heno, ond dyma ambell beth na fyddwch chi, hwyrach, wedi’u gweld o’r blaen.

Ychydig o gyd-destun i’r rhaglen gyntaf: ar wahân i Heno (a Pobol y Cwm, oedd yn dychwelyd yr un noson), tybed beth arall oedd ar S4C nos Lun, Medi’r 17eg 1990?

Yn graidd i Heno oedd y syniad o adael y Gaerdydd ddinesig a dod ag S4C yn agosach at y gwylwyr – yn llythrennol felly, drwy adeiladu stiwdio newydd sbon yng Nghanolfan Siopa Dewi Sant, Abertawe. Symudodd y rhaglen i Lanelli tua throad y mileniwm, a maes parcio sydd ar safle’r hen stiwdios bellach (sy’n fwyaf nodedig am fod yn gartref i un o weithiau’r artist cyfoes, Jeremy Deller).

Ond ychydig flynyddoedd cyn dymchwel yr adeilad, mi es i grwydro’r cyrion. Dyma gasgliad Flickr bychan o’r hyn welais i.

Penblwydd hapus iawn i Heno, felly, oddi wrtha i a’r Bois. Unrhyw un am roi punten ar Grammos?

beto_1990-11-02

How Jordan invented the iPlayer (sort of)

Charlotte Higgins’ excellent series on the BBC’s past, present and future has unearthed some gems; take this, for example, from her last-but-one instalment:

[BBC iPlayer] was the product, so BBC folk memory goes, of a drunken night out in 2003 after a digital worker got into trouble posting an inappropriate photograph of the model Katie Price on the BBC3 website. Requiring a redemptive idea to stave off disgrace, he and colleagues came up with the notion of a video-on-demand service for the channel. Four years and 86 internal meetings later, the iPlayer was born.

Englynion ‘gweddol dda’ am y chwaraeydd recordiau, o Eisteddfod 1900

Wedi bod yn hel sgwarnogod drwy’r dydd o ran ymchwil, ond wrth geisio a methu canfod yr union ffynhonnell sydd angen arna i, dyma dod ar draws perl o gystadleuaeth o Eisteddfod Genedlaethol Lerpwl, 1900. Yn agos at ddiwedd y gyfrol cyfansoddiadau (neu, i fod yn fanwl gywir, cyfrol yr ‘Eisteddfod Transactions’, sydd hefyd yn cynnwys 28 tudalen uniaith Saesneg diflas iawn ar hynt yr Eisteddfod ei hun) fe gewch chi’r feirniadaeth hon ar gystadleuaeth yr englyn.

Wn i ddim a enillodd ‘geirseinydd’ ei blwy yn Gymraeg ar gyfer ‘gramophone’ Edison, ond doedd yr un o’r 89 englyn yn ddigon da i gyfiawnhau colli gini o goffrau’r Steddfod, mae’n debyg. Ffugenw gorau’r gystadleuaeth o bell: Trebor Lleifiad, fyddai’n deitl gwych i B-movie Cymraeg.

Ataliwyd y wobr.

ENGLYN – “Y Geirseinydd.” Gwobr, £1 1s. Beirniad – BERW.
Y Feirniadaeth

Allan o’r pentwr englynion sydd ger fy mron – naw a phedwar ugain mewn nifer – y mae o’r hyn lleiaf naw o rai gwallus ac afreolaidd, sef eiddo Morben, Adlais (1), Dyn byddar, Y Fi, Iota, Cerddgar, Llerpwll, Rhodwyalog, a Trebor Lleifiad.

Nis gellir fodd yn y byd ddweyd fod yma gystadleuaeth ragorol. Englynion digon cyffredin ydyw hyd yn nod y goreuon. Ond yr wyf fi wedi pigo saith o rai gweddol dda, sef cynyrchion Amman, Ap Tubal, Un o’r dorf, Ap Celf, Edison (1), Briglwyd, ac Idris Hywel.

Yr englyn goreu genyf fi ydyw yr un canlynol gan Briglwyd :-

Gwir oll, ddyfeisgar Allu, – ti yn hwn
Ro’ist nerth i barablu;
Yn ddi-wall ef, yn ngwydd llu,
Wnel i feirwon lefaru.

Ond, yn anffodus, y mae y llinell olaf wedi ymddangos eisoes mewn englyn i’r Ysgrifbin, ac yn eiddo cyhoeddus er’s blynyddau. Gresyn hyny hefyd, oblegyd y mae hi yn fwy llythyrenol gywir am y Geirseinydd.

Wedi gorfod troi Briglwyd o’r neilldu am y rheswm hwn, ystyriaf mai Idris Hywel yw yr agosaf ato, er na’m boddheir i yn ei englyn. Gwan ydyw “hynod” yn yr ail linell, ac nid wyf yn hoffi “swn dyn” yn y llinell olaf. Dyma englyn Idris Hywel :-

Parablydd newydd o nod, – gwir swynol,
Yw’r Geirseinydd hynod;
Un diwefus, didafod,
A swn dyn o’i gorn sy’n dod.

Cilfachau electronig

Mi wnes i addo hwn i ambell berson ar Twitter, felly dyma chi: PDF o bapur wnes i ei gyhoeddi yng nghyfnodolyn Cyfrwng yn 2010, sy’n bwrw golwg ar hanes cynnar iawn y Gymraeg ar-lein. Dyw’r ffurf PDF ddim yn wych ar gyfer y fath beth, a gobeithio caf i gyfle cyn bo hir i droi’r erthygl yn HTML synhwyrol. Beth bynnag, am y tro:

Cilfachau electronig: geni’r Gymraeg ar-lein, 1989-1996 (PDF, 230k)

Os oes gan unrhyw un sylwadau, neu awgrymiadau, neu gywiriadau, croeso mawr iawn i chi adael sylw. Mae na lwyth o bethau eraill yr hoffwn i eu dweud am hyn i gyd bellach, wrth reswm, ond mae safle gwych Hanes y We Gymraeg gystal lle â dim i’r drafodaeth honno.

 

Ana(b)log

Wnes i gychwyn swydd newydd yn gynharach y mis ‘ma, a dyna’r prif reswm pam eich bod chi’n darllen hwn, am wn i.

Lecturer in Digital Media, medd yr hyn sydd ar fy nrws – darlithydd cyfryngau digidol, felly, fyddai’r teitl Cymraeg pe byddwn i’n gwneud unrhyw ddysgu trwy gyfrwng yr iaith honno. Ond peidiwch dweud wrth neb, ond rydw i’n bur anesmwyth ynglŷn â’r peth. Nid â’r swydd, deallwch – dyma sut oeddwn i’n teimlo pan wnes i gychwyn, a rydw i dal ar ben fy nigon.

Y broblem yw’r bali gair ‘digidol’ yna. Ymgais amlwg yw e, gan benaethiaid cwricwlwm, i geisio diffinio’r hyn rwy’n ei wneud. Ond yn bell o fod yn rhywbeth blaengar, dibroblem, mae i’r digidol, ac i’r holl gysyniad o ddigidol yn gyffredinol, ei broblemau. Gadewch i fi geisio dangos gymaint o syniad gwael oedd hi i roi’r swydd i fi, wrth i fi’ch drysu chi drwy dechnoleg.

Felly, ddosbarth, dychmygwch fy mod am wybod pa mor dwym yw hi. Dyma i chi thermomedr digidol sy’n gwneud hynny. Beth yw’r dymheredd, nawr, fan hyn?

Wel, ateb digon hawdd, meddech chi. 19.5 gradd Celsiws.

O’r gorau, ddweda i. Beth am y thermomedr merciwri ma? Chi’n gwybod: yr un analog?

A dyma chi’n syllu ar y thermomedr, ac yn sylweddoli hwyrach nad oedd yr ateb digidol mor gywir â hynny. Roedd yn eitha agos i’w le, ond, wrth graffu’n fanwl, fe welwch chi fod 19.7 gradd yn agosach ati. Ac os dewiswch chi ddefnyddio chwyddwydr, neu feicrosgop, neu beth bynnag arall, fe ddewch yn agosach, agosach fyth at y tymheredd go iawn.

Fe welwch chi’r pwynt, gobeithio – ceisio’u gorau glas i efelychu deunydd y byd cig a gwaed wna’r pethau ‘digidol’ ‘ma. Mae ‘na fanteision i wneud hynny, wrth gwrs. Os ydych chi’n gwybod unrhyw beth am theori signalau, fe wyddoch chi fod deunydd digidol yn llawer haws ei drosglwyddo’n glir o’r naill fan i’r llall, heb fod unrhyw ddeunydd arall yn torri ar ei draws. Ac unwaith bod gwybodaeth ar ffurf ddigidol, mae cyfrifiaduron y byd yn medru derbyn, trawsffurfio, dehongli ac anfon mlaen y deunydd hwnnw ar amrantiad: wel, dyna’r theori, o leiaf.

Felly mae’r digidol yn dda, ac yn bŵerus – o fewn rheswm. Gwych iawn os ydych chi’n ceisio anfon dogfen o’r naill ran o’r byd i’r llall: mi wnaiff gyrraedd pen ei thaith yn llawer cyflymach os yw ar ffurf ebost yn hytrach na phapur mewn amlen.

Y peth yw,  mae’r digidol yn llawer llai da, ac yn beryglus hyd yn oed, os ydych chi’n ceisio ei ddefnyddio fel ffordd i ddadlau. Hynny yw, os ydych chi wastad yn anelu at y sero neu’r un, y du neu’r gwyn, y naill begwn neu’r llall. A dyna, fel y gwyddoch chi’n iawn, sy’n nodweddu gymaint o sgyrsiau ar-lein. Dydw i ddim am neidio i dir Marshall McLuhan a thaeru mai’r ‘cyfrwng yw’r neges’ yn gyfangwbl, ond mae’n glir i bawb, rwy’n siŵr, bod ambell gyfrwng yn arwain ei ddenfyddwyr i lawr y llwybr deuaidd hyn. Camp ar y mwyaf yw ceisio cyfathrebu syniadau cymhleth o fewn y 500 o nodau mae sylw YouTube yn ei roi i chi, er enghraifft, heb son am y dim-ond-140 gewch chi wrth drydar.

Ond digon o besimistiaeth. Mae’n edrych yn debyg, i fi, fod na ddadeni o flogio’n digwydd yng Nghymru ar hyn o bryd, a rydyn ni wedi ail-ddarganfod ein rhith-fro ni i raddau helaeth. Mae gan Ifan, Rhodri, Dafydd a Carl, i enwi ond pedwar, gyfraniadau swmpus iawn i bob math o ddadleuon cyfoes. A hyd yn oed pan nad ydw i’n cytuno gant y cant â’r hyn maen nhw’n ei ddweud, mae eu harddull yn gwahodd eraill i gyd-drafod, i gyd-ddadlau ac i gyd-adeiladu eu dadleuon gyda nhw. Nid ‘ie’ neu ‘na’ gewch chi gan y blogwyr gorau, yn fy nhyb i, ond canllaw i’r mannau meddyliol sydd rywle rhwng y ddau begwn. Yn eu meddylfryd, maen nhw’n llawer agosach at yr analog na’r digidol – mae rhesymeg annelwig, weithiau, yn wych o beth.

Felly’r blog hwn hefyd, gobeithio. Dydw i erioed wedi bod yn berson sy’n hoff o eithafion unrhyw ddadl, a rwy’n gobeithio y medra i archwilio’r hyn sy’n fy niddori heb godi gwrychyn neb (ac os gwnaf i, fydd hynny ddim yn fwriadol). Fe flogia i yn y Gymraeg a’r Saesneg yn ôl fy mympwy, am mai dyna’r math o berson ydw i, er gwell neu waeth. Bydd y mwyafrif o gofnodion o ryw ddefnydd i’m myfyrwyr i, ond fydda i ddim yn ceisio eithrio neb sydd ddim yn deall y dechnoleg na’r syniadaeth y tu ôl iddo.

Ac fy mwriad yw i hwn fod yn hwyl hefyd. Wel, i mi o leiaf. Cawn weld…